支持中心
Tech Support
mobivision quantify
可以用于分析MobiNova平臺下機(jī)的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),關(guān)鍵分析步驟如下圖所示:
MobiNova平臺下機(jī)的單細(xì)胞轉(zhuǎn)錄組分為3'轉(zhuǎn)錄組和5’轉(zhuǎn)錄組兩種,均可使用mobivision quantify
進(jìn)行分析。
單細(xì)胞3'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:
單細(xì)胞5'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:
從Read結(jié)構(gòu)可知,無論是5'轉(zhuǎn)錄組還是3'轉(zhuǎn)錄組,其Read1的5’端均為細(xì)胞標(biāo)簽序列(20bp)和UMI序列(10bp)。為了確定Read1所攜帶的細(xì)胞標(biāo)簽序列是否正確,MobiVision會將測序片段中的細(xì)胞標(biāo)簽序列和已知白名單中的細(xì)胞標(biāo)簽序列進(jìn)行比對。目前MobiCube 高通量單細(xì)胞3'轉(zhuǎn)錄組v2.0試劑盒提供近3,000,000種細(xì)胞標(biāo)簽序列。符合以下條件的測序片段將被保留:
通過的測序片段,Read1僅保留糾正后的細(xì)胞標(biāo)簽序列和UMI序列,Read2在該步驟暫不做處理。
對于糾正細(xì)胞標(biāo)簽序列后的fastq數(shù)據(jù),理論上,Read1不再含有接頭序列,因此無需特殊處理。
mobivision quantify
的采用STARsolo進(jìn)行比對,比對注釋結(jié)果如下圖所示:
MobiVision v2.0及以后版本在統(tǒng)計(jì)transcriptomic reads時,默認(rèn)的操作模式是包含內(nèi)含子(--intron included)。在這種模式下,只要一個測序片段有大于等于50%的長度比對至內(nèi)含子和/或外顯子區(qū)域,該片段就被定義為transcriptomic read。而如果選擇了--intron excluded模式,那么該測序片段必須要有100%的長度比對至外顯子區(qū)域,才能被定義為transcriptomic read。
mobivision quantify記錄了所有比對到基因組上的測序片段,其中,當(dāng)測序片段比對質(zhì)量MAPQ=255時,表示該測序片段比對至基因組唯一區(qū)域。而只有唯一比對至轉(zhuǎn)錄組區(qū)域的測序片段,才會進(jìn)入下游的UMI計(jì)數(shù)。
在進(jìn)入U(xiǎn)MI計(jì)數(shù)前,需要剔除Reads比對結(jié)果中,不符合條件的UMI。
經(jīng)過上述過濾條件,保留下來的UMI信息和細(xì)胞標(biāo)簽序列可構(gòu)建生成raw-cell-gene-matrix矩陣。
mobivision quantify
目前提供兩種細(xì)胞過濾的算法,分別是CR2.2和EmptyDrops (Lun等人于2019年發(fā)表在Genome biology中的算法)。如果用戶需要指定細(xì)胞數(shù)目,也可通過--cellnumber INT 來選擇含有UMI數(shù)目排列前INT個的細(xì)胞標(biāo)簽作為有效細(xì)胞。
對于來源于兩個物種的混合樣本,例如人和小鼠,mobivision quantify
將細(xì)胞分成了三種情況:來源于人的細(xì)胞、來源于小鼠的細(xì)胞及人鼠混合的細(xì)胞(multiplet)。mobivision quantify
認(rèn)為,單個細(xì)胞標(biāo)簽中,只有不少于90%的UMI分子來源同一物種,該細(xì)胞標(biāo)簽才會被認(rèn)為來是源于這個物種的細(xì)胞。例如,當(dāng)某個細(xì)胞標(biāo)簽中,80%的UMI來源于物種1,另外20%的UMI來源于物種2,那么mobivision quantify
會判定該細(xì)胞為multiplet。雖然mobivision quantify
無法直接判斷文庫中的雙胞或多胞率,但是通過multiplet的計(jì)算,我們可以間接評估文庫中雙胞或多胞的情況。若文庫中存在雙胞或多胞的情況,那么理論上,物種1+物種1的情況應(yīng)占1/4,物種2+物種2占1/4,物種1+物種2占1/2。例如,某雙物種文庫中,multiplet rate為5%,可以估算,該文庫中,雙胞或多胞率應(yīng)在10%左右。
mobivision quantify
默認(rèn)在filtered-cell-gene-matrix細(xì)胞表達(dá)矩陣生成后,對整個文庫的原始數(shù)據(jù)及分析結(jié)果進(jìn)行統(tǒng)計(jì),生成質(zhì)控報(bào)告。該報(bào)告是對整個文庫的如實(shí)反饋,旨在幫助用戶從宏觀角度了解文庫原始數(shù)據(jù)質(zhì)量及分析結(jié)果質(zhì)量,并未作任何數(shù)據(jù)上的篩選或過濾。如有需要,用戶可根據(jù)質(zhì)控報(bào)告結(jié)果,對文庫結(jié)果進(jìn)行調(diào)整后,再開始下游分析。