北京基因組所等開發(fā)基于深度學習模型的空間轉(zhuǎn)錄組精細分辨率細胞注釋算法
| 來源: 【字號:大 中 小】
細胞在組織和器官內(nèi)的空間位置與其功能相關(guān)。新興的空間轉(zhuǎn)錄組技術(shù)能夠在組織中原位捕獲轉(zhuǎn)錄信息,為解析基因表達譜從而解碼細胞空間分布、破譯組織的空間結(jié)構(gòu)、探討復雜的生物學功能提供了條件。
同時,現(xiàn)有的計算方法通過反卷積等方式實現(xiàn)了捕獲域內(nèi)混合細胞類型注釋,但未對捕獲域間未測量區(qū)域細胞類型進行填補,且分辨率提升空間有限。現(xiàn)有方法聚焦于基因表達信息,但未結(jié)合形態(tài)學信息進行細胞注釋,且注釋準確度有待提高。
近日,中國科學院北京基因組研究所(國家生物信息中心)楊運桂團隊和數(shù)學與系統(tǒng)科學研究院張世華團隊合作,在《基因組生物學》(Genome Biology)上發(fā)表了題為STASCAN deciphers fine-resolution cell-distribution maps in spatial transcriptomics by deep learning的研究論文。該團隊針對不同空間轉(zhuǎn)錄組技術(shù)、不同生物組織建立了解碼細胞空間精細分布、解析特異組織結(jié)構(gòu)的新工具——STASCAN。
STASCAN基于深度學習模型,整合空間轉(zhuǎn)錄組基因表達數(shù)據(jù)和組織學圖像,實現(xiàn)組織切片未測量區(qū)域細胞類型預測及測量區(qū)域捕獲域內(nèi)細胞細分注釋。STASCAN的優(yōu)勢在于能夠以高精度進行細胞類型注釋并增強細胞空間分辨率,解析原始分辨率下無法識別的精細組織結(jié)構(gòu),進一步揭示細胞類型小生境,加速研究人員對發(fā)育和疾病的認知。同時,STASCAN僅基于相鄰切片的組織學圖像生成細胞分布圖,從而能夠構(gòu)建更詳細的3D細胞圖譜,并減少實驗成本。
STASCAN在公共渦蟲空間數(shù)據(jù)集中進行原始分辨率下的基準測試,優(yōu)于其他算法的精準細胞注釋,能夠僅從圖像預測細胞類型。進一步,STASCAN可以在渦蟲數(shù)據(jù)集中應(yīng)用3個功能模塊,揭示原始分辨率下無法識別的精細組織結(jié)構(gòu),定位細胞混合物的組成及其在亞分辨率下的不同位置,僅基于鄰近染色圖像實現(xiàn)細胞分布預測,構(gòu)建超原始分辨率6倍的精細細胞三維分布圖譜。
STASCAN可以應(yīng)用于不同空間轉(zhuǎn)錄組學技術(shù)的跨物種的多個數(shù)據(jù)集。STASCAN在人類腸道數(shù)據(jù)集中定位腸道組織不同細胞層的邊界;在人類肺數(shù)據(jù)集中特異識別微米級精細結(jié)構(gòu);在人類心肌數(shù)據(jù)集中預測測序缺失區(qū)域中的潛在細胞分布,重繪人體心肌梗死組織中的空間結(jié)構(gòu)變化;在小鼠胚胎腦數(shù)據(jù)集中解碼細胞空間精細分布,復刻小鼠腦發(fā)育過程中組織解剖學結(jié)構(gòu)。
STASCAN提供了用于整合空間基因表達信息和組織學圖像進行精細分辨率細胞注釋的工具,在解碼細胞空間精細分布和解析特異組織結(jié)構(gòu)方面具有優(yōu)勢。隨著空間轉(zhuǎn)錄組技術(shù)的發(fā)展和數(shù)據(jù)的積累,STASCAN有望為大規(guī)??臻g轉(zhuǎn)錄組數(shù)據(jù)的整合分析提供支持。
研究工作得到國家重點研發(fā)計劃和國家自然科學基金等的支持。
STASCAN模型框架圖