中文字幕人妻第一区|国产午夜福利无码视频|久久久久综合给合狠狠狠|久久厕所精品国产精品亚洲|国产自啪精品视频网站丝袜|成人亚洲国产精品一区不卡|亚洲大尺度无码无码专线一区|福利一区二区三区四区在线观看

服務(wù)熱線02152235399
當(dāng)前位置:首頁 > 科學(xué)研究 > 科研文獻(xiàn)
烈冰生信云平臺(tái)助力單細(xì)胞測序半監(jiān)督深度學(xué)習(xí)算法DISC——推測dropouts基因結(jié)構(gòu)和表達(dá) 時(shí)間:2020-08-24

單細(xì)胞轉(zhuǎn)錄組測序在單細(xì)胞層面對轉(zhuǎn)錄組進(jìn)行測序與分析,現(xiàn)正被廣泛應(yīng)用于分析細(xì)胞的異質(zhì)性與多樣性。但是,過多的假零表達(dá)一直是困擾單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)分析的問題之一,該問題被稱為dropouts,它會(huì)扭曲基因的表達(dá)分布,并造成細(xì)胞類型分類的錯(cuò)誤。而且,由于近年來單細(xì)胞測序技術(shù)與產(chǎn)業(yè)迅速發(fā)展,單次單細(xì)胞測序?qū)嶒?yàn)的通量已從數(shù)千個(gè)細(xì)胞大幅提升到百萬級的細(xì)胞數(shù)量,而對于單個(gè)細(xì)胞的測序深度則較淺,這使得dropouts問題更為嚴(yán)重。

2020710日,中山大學(xué)中山眼科中心謝志課題組開發(fā)了一個(gè)名為DISC的,基于半監(jiān)督學(xué)習(xí)方式的深度學(xué)習(xí)網(wǎng)絡(luò),用于解決dropouts問題。通過DISC可以推斷出被扭曲了表達(dá)與結(jié)構(gòu)基因的真實(shí)情況?;?/span>10個(gè)真實(shí)的單細(xì)胞轉(zhuǎn)錄組測序數(shù)據(jù)集,將DISC與其他7種高水準(zhǔn)推斷方法進(jìn)行比較,DISC始終優(yōu)于其他方法。謝志教授是烈冰科技生信云平臺(tái)的重要合作伙伴,雙方建立了深入的合作學(xué)習(xí)關(guān)系。該研究以“DISC: a highly scalable and accurate inference of gene expression and structure for single-cell transcriptomes using semi-supervised deep learning”為題,發(fā)表在國際知名期刊Genome Biology上。




研究思路


研究結(jié)果展示


1.DISC簡介

DISC是基于半監(jiān)督學(xué)習(xí)方式的深度學(xué)習(xí)算法,用于解決單細(xì)胞測序數(shù)據(jù)中的假零表達(dá)的dropouts問題。DISC包含一個(gè)自動(dòng)編碼器、一個(gè)遞歸預(yù)測器、一個(gè)計(jì)算推算表達(dá)式特征的推算器和一個(gè)計(jì)算重構(gòu)表達(dá)式特征的重構(gòu)器,推算器用于學(xué)習(xí)正常基因的表達(dá),重構(gòu)器同時(shí)學(xué)習(xí)正?;虻谋磉_(dá)和推算器分配的零表達(dá)基因的偽表達(dá),預(yù)測器同時(shí)學(xué)習(xí)正?;虻谋磉_(dá)和同一步驟的解碼器分配的零表達(dá)基因的偽表達(dá),最后推斷出假零基因的真實(shí)表達(dá)。DISC還能通過自動(dòng)編碼器將原始數(shù)據(jù)在保留原始特征的同時(shí)進(jìn)行降維,使其可以把大型數(shù)據(jù)集壓縮到一個(gè)較低的維度,使得其在處理時(shí)依舊能保持較高的性能。


2.DISC對超大型數(shù)據(jù)集有較好的擴(kuò)展性

作者將DISC與其他7個(gè)已有的高水準(zhǔn)推斷真實(shí)表達(dá)算法進(jìn)行比較運(yùn)行時(shí)間與內(nèi)存占用進(jìn)行了比較,發(fā)現(xiàn)DISC在處理大型及超大型數(shù)據(jù)集,相對于其他算法,運(yùn)行時(shí)間更短,內(nèi)存占用更少。


3.DISC改善了基因表達(dá)結(jié)構(gòu)

接下來為了系統(tǒng)評估DISC恢復(fù)丟失的基因表達(dá)結(jié)構(gòu)的性能,作者使用了三種檢驗(yàn)方法進(jìn)行評估,并與FISH的結(jié)果進(jìn)行比較?;虮磉_(dá)分布使用Gini系數(shù)的RMSE進(jìn)行評估,基因之間的分布相關(guān)性用FF score評估,基因共表達(dá)的相關(guān)性用CMD評估。結(jié)果顯示,在MELANOMASSCORTEX兩個(gè)獨(dú)立數(shù)據(jù)集的驗(yàn)證中,相比于其他算法,DISC都有很好的恢復(fù)丟失基因表達(dá)結(jié)構(gòu)的性能。


4.DISC精確修復(fù)dropout問題

下一步是驗(yàn)證DISC恢復(fù)基因真實(shí)表達(dá)性能,但由于單細(xì)胞測序數(shù)據(jù)無法提供dropouts的真實(shí)數(shù)據(jù),所以使用了來自三個(gè)不同單細(xì)胞測序平臺(tái)生成的數(shù)據(jù)合并后的數(shù)據(jù)作為參考。作者使用MAE評估恢復(fù)基因真實(shí)表達(dá)的準(zhǔn)確性,DISC在所有的數(shù)據(jù)集中都有極好的表現(xiàn),顯著地恢復(fù)了基因表達(dá)。對于基因相關(guān)性和細(xì)胞相關(guān)性,DISC與其他七種方法相比,在所有數(shù)據(jù)集上的其相關(guān)系數(shù)都是最高的。而在使用CMD評估基因共表達(dá)時(shí),DISCscImputeVIPER與參考最為匹配,而其他方法都產(chǎn)生了大量的假共表達(dá)關(guān)系。這些數(shù)據(jù)表明,DISC準(zhǔn)確恢復(fù)了dropout產(chǎn)生的基因表達(dá)丟失,改善了被扭曲的基因結(jié)構(gòu)。


5.DISC改善了細(xì)胞類型識(shí)別

在修復(fù)dropout問題的基礎(chǔ)上,DISC能否提高細(xì)胞類型識(shí)別的準(zhǔn)確度你?作者使用了10X GenomicsDrop-seqSPLiT-seq三個(gè)不同單細(xì)胞測序平臺(tái)產(chǎn)生的數(shù)據(jù)集,以正確分配的細(xì)胞百分比(△ACC)來反映細(xì)胞類型分類的準(zhǔn)確性。在三個(gè)不同的數(shù)據(jù)集中,DISC的性能都是最好的,且許多罕見細(xì)胞類型也能很好的恢復(fù)。表明DISC能有效提高細(xì)胞類型識(shí)別的準(zhǔn)確性,而且在不同平臺(tái)不同的數(shù)據(jù)集中都有穩(wěn)定的表現(xiàn)。


6.DISC改善了下游分析結(jié)果

獲得了更好的基因結(jié)構(gòu)是應(yīng)該能轉(zhuǎn)化為更好的下游分析結(jié)果。為了驗(yàn)證下游分析結(jié)果的提升,作者使用了三個(gè)指標(biāo)進(jìn)行評估。一是使用推算的scRNA-SeqBulk RNA-Seq數(shù)據(jù)之間的Spearman相關(guān)性評估兩組數(shù)據(jù)的相關(guān)性,二是scRNA-seq數(shù)據(jù)和Bulk RNA-seq數(shù)據(jù)識(shí)別的差異基因之間的相似性,三是推斷的擬時(shí)序結(jié)果與已知細(xì)胞分化順序之間的相似性。在三個(gè)指標(biāo)評估中,DISC都有較好的表現(xiàn),表明DISC能夠改善下游分析結(jié)果,提供更多的生物學(xué)意義信息。


7.DISC能可靠地識(shí)別小鼠大腦130萬細(xì)胞數(shù)據(jù)集中的細(xì)胞群

最后,作者使用了真實(shí)的小鼠大腦超大型數(shù)據(jù)集BRAIN_1.3M來驗(yàn)證DISC的性能,該數(shù)據(jù)集由多個(gè)大腦區(qū)域的細(xì)胞數(shù)據(jù)生成,數(shù)據(jù)量大且復(fù)雜。分析得到的結(jié)果與Allen腦圖譜中的已知Marker基因進(jìn)行比較,發(fā)現(xiàn)DISC的結(jié)果在所有算法中更接近圖譜的細(xì)胞比例,且能更好的識(shí)別細(xì)分的細(xì)胞類型,與常用細(xì)胞類型識(shí)別工具Seurat的結(jié)果也更為一致。結(jié)果說明DISC能夠高效準(zhǔn)確地處理超大型復(fù)雜單細(xì)胞數(shù)據(jù)集,并能精確分析出主要和稀有細(xì)胞群。


綜上所述,DISC提供了一個(gè)單細(xì)胞數(shù)據(jù)的通用解決方案,對于具有稀有表達(dá)的基因,以及超大型數(shù)據(jù)集都有很好的處理性能,最大限度地減少了信息丟失。DISC將成為快速發(fā)展的單細(xì)胞測序技術(shù)極大的助力。




原文鏈接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02083-3


上海烈冰生物成立十年始終秉乘“創(chuàng)新、求實(shí)、前沿”的企業(yè)理念和“以客戶為根本”的服務(wù)宗旨,憑借高通量測序平臺(tái)及NovelBrain®云平臺(tái)生信分析的雙重優(yōu)勢,致力于提供高品質(zhì)、高效率的技術(shù)服務(wù)。截止目前,烈冰已和1000+家頂尖科研機(jī)構(gòu)、醫(yī)院和醫(yī)藥企業(yè)合作了5000+項(xiàng)重要項(xiàng)目。

詳情咨詢當(dāng)?shù)劁N售或者電話021-51827998



烈冰NovelBrain®單細(xì)胞云平臺(tái)

不僅助力算法開發(fā),還可以自己輕松做數(shù)據(jù)分析~

  • 國內(nèi)最大的生物云平臺(tái)供應(yīng)商,頂尖的云計(jì)算架構(gòu)團(tuán)隊(duì),兩年精心研發(fā),歷經(jīng)數(shù)千項(xiàng)目檢驗(yàn)。

  • 0代碼分析過程、一鍵式結(jié)果報(bào)告、三維可視化的單細(xì)胞瀏覽器,助力每一位科研工作者擺脫生信代碼的煩惱,只需上傳數(shù)據(jù),即可輕松分析數(shù)據(jù),深入挖掘生物學(xué)意義。

  • 60+項(xiàng)前沿單細(xì)胞分析工具,簡單便捷化拖拽操作、高度定制化分析流程,大幅度提升單細(xì)胞數(shù)據(jù)分析效率。

快來注冊-登錄,體驗(yàn)一下吧!

網(wǎng)址:singlecell.novelbrain.com

烈冰單細(xì)胞瀏覽器教你完美解讀scRNA-Seq數(shù)據(jù)分析結(jié)果

利用NovelBrain單細(xì)胞云探尋新冠病毒受體ACE2在人體器官中的分布


單細(xì)胞云平臺(tái)數(shù)據(jù)分析教程:



熱點(diǎn)回顧:

  1. 烈冰助力||可變剪接+全轉(zhuǎn)錄組測序助力客戶文章三連發(fā)

  2. 烈冰助力||單細(xì)胞RNA測序鑒定半月板祖細(xì)胞并揭示半月板退變機(jī)制

  3. 利用NovelBrain單細(xì)胞云探尋新冠病毒受體ACE2在人體器官中的分布

  4. 單細(xì)胞測序知多少——single cell分選平臺(tái)(10X Genomics,BD Rhapsody)

  5. @烈冰生物,請給我一份單細(xì)胞轉(zhuǎn)錄組測序數(shù)據(jù)分析攻略

  6. 了解植物單細(xì)胞,從了解擬南芥的根開始

  7. 【空間轉(zhuǎn)錄組】第一彈之原理與樣本制備,你都了解了嗎?

  8. 空間轉(zhuǎn)錄組樣本不合格?細(xì)節(jié)決定成敗,烈冰送您最詳細(xì)的空轉(zhuǎn)樣本準(zhǔn)備指南

  9. ScATAC-seq——原理及實(shí)驗(yàn)流程大起底

  10. 單細(xì)胞核轉(zhuǎn)錄組測序(snRNA-Seq)揭示人與小鼠在阿爾茲海默氏疾病中的差異