澳门金沙游戏

澳门金沙游戏劉琦教授課題組《自然·通訊》發文—開發基於人工智能模型的單細胞CRISPR篩選數據分析新方法

發佈時間:2019-05-21  

澳门金沙游戏生物信息學系劉淇教授成功開發了基於主題建模的單細胞CRISPR篩選數據分析方法。相關研究論文《Model-based Understanding of Single-cell CRISPR screening》於5月20日在線發表《自然·通訊》(自然通訊)[1] 。

d77cf041-65db-4da7-a6af-748b2109f45d.jpg

                   圖1:基於主題模型的單細胞CRISPR篩選數據的分析流程圖

CRISPR篩選是一種有效的高通量實驗技術,用於揭示基因功能和進行基因篩選。最近,單細胞導向的CRISPR篩選技術(稱爲Perturb-Seq ,CRISP-seq和CROP-seq等)使研究人員能夠通過結合傳統CRISPR篩選和單一細胞的各自優勢,在單細胞水平上工作  。 - 細胞測序技術。實施大規模遺傳擾動,以更精確和準確的尺度檢測和評估基因擾動 ,適用於高度異質細胞類型(如腫瘤細胞,免疫細胞等)的大規模遺傳功能研究 。靶標篩選。隨着該技術的出現,該數據類型的數據建模方法的發展對於闡明覆雜疾病的發生和發展機制以及藥物靶標的有效篩選具有重要的研究意義。然而,這項技術數據分析有幾個挑戰:1)單細胞測序技術和CRISPR篩選技術各自都有巨大的噪音,單細胞CRISPR篩選技術的結合使得數據本身的噪音加劇 ,迫切需要發展噪音 。棒數據分析方法; 2)對於單細胞CRSIPR篩查,如何設計一種有效的算法來定量測量sgRNA的敲除/敲除效率並評估其潛在的脫靶效應? 3)在單細胞水平,您如何定量分析和評估擾動基因對細胞表型的影響以及兩種干擾之間的關係? 4)如何在視覺上有效地觀察擾動基因對細胞的影響?

針對上述單細胞CRISPR篩查數據分析中存在的問題,劉琦教授提出了一種基於人工智能主題模型的計算框架MUSICModel-basedUSIngle單元的理解CRISPR篩選)用於有效分析單細胞CRISPR篩選數據 。 MUSIC將單細胞CRISPR篩選數據分析與自然語言處理中的大規模文本處理進行比較 ,並通過主題模型推斷數據本身中包含的隱藏變量的分佈 ,以進一步揭示數據 。其生物學意義體現在其中。其數據建模過程包括三個步驟:1)數據預處理 。除了考慮單細胞測序過程中普遍存在的噪聲和相應的預處理方法外,MUSIC還根據單細胞CRISPR篩選數據的特點設計了幾個有效的數據預處理步驟,例如考慮敲除/敲入效率sgRNA。干擾小區的最小數量用於有效濾除噪聲小區樣本; 2)模型建立 。主題模型用於模擬單細胞CRISPR篩選數據以獲得擾動基因對細胞表型的影響的主題分佈。主題分佈可用於定量表徵基因擾動產生的細胞表型效應; 3)基於主題的模型定量和準確地繪製基因擾動對細胞表型的影響  ,並基於擾動基因的功能測序的影響,促進大規模基因靶標篩選和基因功能註釋 。基於R語言開發 ,MUSIC計算平臺提供Docker版本 ,以便快速高效地安裝,部署和使用 ,以及對大規模實驗數據集進行系統比較和測試  。 值得一提的是,最近的一篇文章發表在《自然·方法》(自然方法)上關於開發cisTopic方法的單細胞ATAC-seq數據分析,核心算法也是基於主題模型,進一步體現了優勢使用人工智能的隱藏變量模型來分析單細胞測序數據[2]。

劉琦教授的研究小組近年來一直致力於基於人工智能機器學習方法的CRISPR基因編輯系統的優化設計。 2018年,劉琦教授的研究小組開發了DeepCRISPR ,這是一種基於深度學習方法的CRISPR基因編輯系統的優化設計軟件平臺。相應的結果發表在國際知名期刊《基因組生物學》(基因組生物學)上 。這項工作被國際權威論文評估系統F1000推薦爲技術進步領域[3]  。在劉奇教授的研究團隊參與2018年的DeepCRISPR工作之後,這項工作是基因編輯系統數據分析領域的另一項有益探索 。論文的第一作者是劉琦教授研究小組的博士生段斌。第一位來文作者是劉琦教授 ,上海交通大學第九人民醫院孫淑陽教授團隊 ,澳门金沙游戏澳门金沙游戏王平教授團隊在這項工作中篩選了單細胞CRISPR。實驗水平理解和數據解釋提供了重要支持。研究成果由科技部關於精準醫學的重點研發計劃 ,慢性病關鍵研發計劃和國家自然科學基金資助 。

[1] Bin Duan等,Qi Liu#,基於模型的單細胞CRISPR篩選理解,Nature Communications ,Advance Access,2019。

[2] CarmenBravoGonzález-Blas等人,cisTopic:順式調控主題建模單細胞ATAC-seq數據 ,Nature Methods ,Advance Access ,2019。

[3] Guohui Chuai等 ,Qi Liu#,DeepCRISPR:優化的CRISPR指導RNA設計深度學習,Genome Biology,Advance Access ,2018 。

Copyright© 2011-2015 澳门金沙游戏, All rights reserved

地址:上海市四平路1239號 電話:021-65981041 傳真:65981041 滬ICP備10014176號