亚洲午夜无码久久久久,亚洲妇女自偷自偷图片,女女互揉吃奶揉到高潮视频,国语成本人片免费AV无码

MobiVision轉(zhuǎn)錄組算法介紹

算法概覽

mobivision quantify可以用于分析MobiNova平臺下機(jī)的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),關(guān)鍵分析步驟如下圖所示:

細(xì)胞標(biāo)簽糾正

MobiNova平臺下機(jī)的單細(xì)胞轉(zhuǎn)錄組分為3'轉(zhuǎn)錄組和5’轉(zhuǎn)錄組兩種,均可使用mobivision quantify進(jìn)行分析。

單細(xì)胞3'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:

單細(xì)胞5'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:

從Read結(jié)構(gòu)可知,無論是5'轉(zhuǎn)錄組還是3'轉(zhuǎn)錄組,其Read1的5’端均為細(xì)胞標(biāo)簽序列(20bp)和UMI序列(10bp)。為了確定Read1所攜帶的細(xì)胞標(biāo)簽序列是否正確,MobiVision會將測序片段中的細(xì)胞標(biāo)簽序列和已知白名單中的細(xì)胞標(biāo)簽序列進(jìn)行比對。目前MobiCube 高通量單細(xì)胞3'轉(zhuǎn)錄組v2.0試劑盒提供近3,000,000種細(xì)胞標(biāo)簽序列。符合以下條件的測序片段將被保留:

  • Read1的細(xì)胞標(biāo)簽存在于白名單中;
  • Read1的細(xì)胞標(biāo)簽不存在于白名單中,但與白名單中的細(xì)胞標(biāo)簽最小漢明距離<=2,并根據(jù)白名單中的細(xì)胞標(biāo)簽,對Read1中的細(xì)胞標(biāo)簽進(jìn)行糾正。

通過的測序片段,Read1僅保留糾正后的細(xì)胞標(biāo)簽序列和UMI序列,Read2在該步驟暫不做處理。

插入片段修剪

對于糾正細(xì)胞標(biāo)簽序列后的fastq數(shù)據(jù),理論上,Read1不再含有接頭序列,因此無需特殊處理。

  • 單細(xì)胞3'轉(zhuǎn)錄組的fastq數(shù)據(jù),Read2片段5'端可能存在30bp的TSO序列(“AAGCAGTGGTATCAACGCAGAGTACATGGG”),3’端可能存在poly A序列。而TSO序列和poly A序列的存在,會有效降低文庫的比對率,因此在比對前,需要將插入片段兩端可能存在的TSO序列和poly A序列去除。單細(xì)胞5'轉(zhuǎn)錄組的fastq序列,Read2片段的5’端可能存在poly T序列,3'端可能存在13bp的TSO反向互補(bǔ)序列(“CCCATATAAGAAA”),同樣需要在比對前去除。
  • 去除接頭序列及poly A和poly T可能導(dǎo)致保留下來的插入DNA片段過短,而過短的DNA片段會增加錯配的概率,因此,在完成接頭序列去除后,還需要過濾除去插入DNA片段小于30bp的Read。

測序片段比對

mobivision quantify的采用STARsolo進(jìn)行比對,比對注釋結(jié)果如下圖所示:

  • 當(dāng)測序片段有超過50%的長度比對至外顯子區(qū)域時,則認(rèn)為該片段為Exonic Read;
  • 當(dāng)測序片段有大于等于50%的長度比對內(nèi)含子區(qū)域時,則認(rèn)為該片段為Intronic Read;
  • 當(dāng)測序片段可比對至基因組,但既不屬于Exonic Read,又不屬于Intronic Read時,則認(rèn)為該片段為Intergenic Read;
  • MobiVision v2.0及以后版本在統(tǒng)計(jì)antisense reads時,默認(rèn)的操作模式是包含內(nèi)含子(--intron included)。在這種模式下,只要一個測序片段有大于或等于50%的長度比對至內(nèi)含子和/或外顯子區(qū)域的反義鏈方向,該片段就被定義為反義鏈read。而如果選擇了--intron excluded模式,那么該測序片段必須要有100%的長度比對至外顯子區(qū)域的反義鏈方向,才能被定義為反義鏈read。
  • MobiVision v2.0及以后版本在統(tǒng)計(jì)transcriptomic reads時,默認(rèn)的操作模式是包含內(nèi)含子(--intron included)。在這種模式下,只要一個測序片段有大于等于50%的長度比對至內(nèi)含子和/或外顯子區(qū)域,該片段就被定義為transcriptomic read。而如果選擇了--intron excluded模式,那么該測序片段必須要有100%的長度比對至外顯子區(qū)域,才能被定義為transcriptomic read。

mobivision quantify記錄了所有比對到基因組上的測序片段,其中,當(dāng)測序片段比對質(zhì)量MAPQ=255時,表示該測序片段比對至基因組唯一區(qū)域。而只有唯一比對至轉(zhuǎn)錄組區(qū)域的測序片段,才會進(jìn)入下游的UMI計(jì)數(shù)。

UMI計(jì)數(shù)

在進(jìn)入U(xiǎn)MI計(jì)數(shù)前,需要剔除Reads比對結(jié)果中,不符合條件的UMI。

  • 由相同堿基構(gòu)成的UMI需去除;
  • 含有N的UMI需去除;
  • 1個或多個相同的UMI比對到同一基因上時,UMI Count記為1;多個相同的UMI比對到不同的基因上時,保留比對至同一基因上UMI最多的比對情況,去除比對至其他基因的UMI,UMI Count記為1;
  • 兩個UMI之間僅相差1個堿基,且比對到相同基因,則認(rèn)為這兩個UMI相同,保留其中一個UMI,UMI Count記為1。

經(jīng)過上述過濾條件,保留下來的UMI信息和細(xì)胞標(biāo)簽序列可構(gòu)建生成raw-cell-gene-matrix矩陣。

細(xì)胞過濾

mobivision quantify目前提供兩種細(xì)胞過濾的算法,分別是CR2.2EmptyDrops (Lun等人于2019年發(fā)表在Genome biology中的算法)。如果用戶需要指定細(xì)胞數(shù)目,也可通過--cellnumber INT 來選擇含有UMI數(shù)目排列前INT個的細(xì)胞標(biāo)簽作為有效細(xì)胞。

對于來源于兩個物種的混合樣本,例如人和小鼠,mobivision quantify將細(xì)胞分成了三種情況:來源于人的細(xì)胞、來源于小鼠的細(xì)胞及人鼠混合的細(xì)胞(multiplet)。mobivision quantify認(rèn)為,單個細(xì)胞標(biāo)簽中,只有不少于90%的UMI分子來源同一物種,該細(xì)胞標(biāo)簽才會被認(rèn)為來是源于這個物種的細(xì)胞。例如,當(dāng)某個細(xì)胞標(biāo)簽中,80%的UMI來源于物種1,另外20%的UMI來源于物種2,那么mobivision quantify會判定該細(xì)胞為multiplet。雖然mobivision quantify無法直接判斷文庫中的雙胞或多胞率,但是通過multiplet的計(jì)算,我們可以間接評估文庫中雙胞或多胞的情況。若文庫中存在雙胞或多胞的情況,那么理論上,物種1+物種1的情況應(yīng)占1/4,物種2+物種2占1/4,物種1+物種2占1/2。例如,某雙物種文庫中,multiplet rate為5%,可以估算,該文庫中,雙胞或多胞率應(yīng)在10%左右。

質(zhì)控報(bào)告

mobivision quantify默認(rèn)在filtered-cell-gene-matrix細(xì)胞表達(dá)矩陣生成后,對整個文庫的原始數(shù)據(jù)及分析結(jié)果進(jìn)行統(tǒng)計(jì),生成質(zhì)控報(bào)告。該報(bào)告是對整個文庫的如實(shí)反饋,旨在幫助用戶從宏觀角度了解文庫原始數(shù)據(jù)質(zhì)量及分析結(jié)果質(zhì)量,并未作任何數(shù)據(jù)上的篩選或過濾。如有需要,用戶可根據(jù)質(zhì)控報(bào)告結(jié)果,對文庫結(jié)果進(jìn)行調(diào)整后,再開始下游分析。