自慰群交第一页女|日本不卡在线优物视频|久久夜色精品国产亚洲AV老牛|538国产精品视频
首頁
高端國際醫(yī)療保險
國內(nèi)臨床醫(yī)學專家
境外高端醫(yī)療服務
按疾病分類
- 胰腺癌
- 肺癌
- 血液病
- 乳腺癌
- 卵巢癌
- 淋巴瘤
- 黑色素瘤
- 肝癌
- 腎癌
- 膀胱癌
- 前列腺癌
- 宮頸癌
- 腦癌
- 艾滋病
- 食管癌
- 胃腸道腫瘤
- 阿爾茨海默病
- 癲癇
- 高血壓及糖尿病
- 失明
- 帕金森氏病
- 新冠肺炎
- 其它
按科技分類
- 靶向藥治療
- 選擇性抑制劑療法
- 免疫細胞療法
- CAR-T細胞療法
- 基因編輯療法
- 疫苗
- 基因檢測
- 硼中子俘獲療法
- 質(zhì)子重離子治療
- 其它
按疾病分類
曉晨團隊開發(fā)新一代深度學習框架,可預測癌癥基因模塊
2024-07-19
來源:轉(zhuǎn)化醫(yī)學網(wǎng)
2024年7月17日,軍事醫(yī)學科學院伯曉晨團隊在期刊《Nature Communications》上發(fā)表了題為“CGMega: explainable graph neural network framework with attention mechanisms for cancer gene module dissection”的研究論文。研究結(jié)果表明,CGMega可用于剖析癌癥基因模塊,并為癌癥發(fā)展和異質(zhì)性,提供高階機制和見解。
研究背景
活細胞的復雜功能,是通過許多基因和基因產(chǎn)物的協(xié)同活動進行的。細胞的大部分活動,被組織成基因模塊:一組共同調(diào)節(jié),以響應不同條件的基因。主動驅(qū)動模塊可以觸發(fā)癌癥的標志,并賦予癌細胞適應性優(yōu)勢。癌癥基因模塊的闡明,可以大大加深科學界對癌癥發(fā)展的理解,并為較佳治療方法的設計,提供信息。
自高通量測序技術發(fā)展以來,基因模塊檢測方法,一直是大型基因藥典生物學解釋的基石。目前使用的方法,主要有兩個缺點。(1)近期的染色體構(gòu)象捕獲技術,揭示了三維(3D)基因組結(jié)構(gòu),并證明了其在建立基因-基因關系方面的關鍵作用。(2)基因模塊表現(xiàn)出高階網(wǎng)絡特征,高階相互作用,調(diào)控生物系統(tǒng)中的復雜功能。 現(xiàn)行大多數(shù)共表達聚類或基于相關性的方法,都無法將重要的組學特征,分配給模塊基因。
圖神經(jīng)網(wǎng)絡(GNN)是測量圖結(jié)構(gòu)數(shù)據(jù)(如生物網(wǎng)絡)的有力方法,并成功對PPI、Hi-C數(shù)據(jù),以及跨蜂窩網(wǎng)絡發(fā)現(xiàn)基因模塊,進行建模。GNN能夠處理不同的Hi-C表示,即將基因?qū)傩宰鳛楣?jié)點特征,或?qū)⒒蛑g的關系,作為圖邊。團隊已經(jīng)證明GNN及其解釋技術,是剖析基因組相互作用之間高階關系的有力工具。
在本研究中,團隊提出了一個新框架(CGMega),用于剖析具有可解釋圖注意力的癌癥基因模塊。團隊將CGMega應用于乳腺癌細胞系和急性髓系白血?。ˋML)患者,并揭示了癌癥基因模塊中基因之間的高階關系。CGMega共同利用了近期GAT在多組學數(shù)據(jù)上的出現(xiàn),并獲得了對癌癥基因模塊層次結(jié)構(gòu)的基本發(fā)現(xiàn)和理解。
研究進展
CGMega在癌癥基因預測中有效
CGMega基于癌癥基因的準確預測,鑒定了基因模塊,因此,團隊測試了CGMega在MCF7細胞系上癌癥基因預測的性能。MCF7細胞系是一種具有高置信度多組學數(shù)據(jù)的人乳腺癌細胞系。CGMega實現(xiàn)了0.9140AUPRC和0.9630的受試者工作特征曲線下面積(AUROC)。為了證明CGMega在癌癥基因預測任務中的進展,團隊將CGMega與各種方法進行了比較,包括通用模型GCN、GAT、MLP、SVM,以及為癌癥基因分類設計的特定模型,包括MTGCN42、EMOGI25和 MODIG43。通過計算AUPRC、AUROC、準確度(ACC)和F1分數(shù),CGMega在這四個指標上的表現(xiàn),優(yōu)于所有其他方法。
團隊采用了CGMega的兩步法。在初始階段,CGMega在MCF7細胞系上進行了預訓練,使其能夠掌握癌癥基因中普遍存在的基本模式和特征。在預訓練之后,團隊對其他癌癥進行了微調(diào),使CGMega能夠適應和微調(diào)其學習的表征,以適應這些罕見癌癥的特定環(huán)境。
為了評估遷移學習的性能,團隊使用K562細胞系上的所有標記基因(597個陽性和1,839個陰性)對非預訓練的CGMega(從頭開始訓練)和預訓練的CGMega進行了測試。隨著標記基因數(shù)量的減少,非預訓練的CGMega的性能急劇下降,而預訓練的CGMega繼續(xù)保持高性能。此外,Hi-C特征在預測方面表現(xiàn)出強大的改進,特別是當標記的基因小于200時。團隊比較了CGMega與其他方法中小樣本遷移學習的性能,預訓練的CGMega具有較高值。
CGMega利用15維基因特征,包括10維組學特征和5維濃縮Hi-C特征,這些特征源自Hi-C數(shù)據(jù)的降維。團隊觀察到,組學和Hi-C特征,都對模型預測做出了貢獻。此外,具有5維濃縮Hi-C特征的CGMega,不如具有10維組學特征的CGMega,表明結(jié)構(gòu)特征可能對組學特征的質(zhì)量具有補償作用。
CGMega在癌癥基因預測任務中的表現(xiàn)。
CGMega為多組學數(shù)據(jù)整合提供新策略
CGMega的卓越表現(xiàn),得益于多組學信息的有效整合,包括基因組、表觀基因組、PPI,尤其是3D基因組架構(gòu)。Hi-C是目前用于研究3D基因組組織的廣泛使用的檢測方法。然而,將Hi-C數(shù)據(jù)與其他組學數(shù)據(jù)一起測量,通常受到其噪聲、稀疏性和可變分辨率的限制。為了在癌癥基因預測任務中獲得較佳性能,團隊測試了具有不同Hi-C數(shù)據(jù)嵌入的集成方法。
通過系統(tǒng)地比較不同的集成方法與Hi-C數(shù)據(jù)嵌入,團隊發(fā)現(xiàn),在癌癥基因預測任務中,使用Hi-C潛在特征作為基因特征,優(yōu)于直接測量Hi-C數(shù)據(jù)作為基因相互作用。SVD是一種有效的降維方法,用于將Hi-C數(shù)據(jù)與其他組學數(shù)據(jù)相結(jié)合。
人乳腺癌細胞系中具有多組學特征的基因模塊
CGMega基于與模型無關的神經(jīng)網(wǎng)絡解釋方法,檢測基因模塊。團隊將CGMega應用于人類乳腺癌MCF7細胞系,并檢查了358個已知癌癥基因的模塊。這些癌癥基因并非隨機分散在基因模塊中,它們往往位于同一模塊中。在這些基因模塊中,TP53的富集程度較高,參與了139個癌癥基因模塊,其次是ESR1(63個參與)和AKT1(61個參與)。除了這些眾所周知的癌癥基因外,團隊還觀察到另外12個高度參與模塊的基因,例如XPO1、NCOR2和PPM1A。團隊還研究了基因模塊的圖形指標的結(jié)構(gòu)特征,包括傳遞性、聚類系數(shù)、度中心性和介介中心性。癌癥基因模塊的拓撲結(jié)構(gòu),明顯優(yōu)于非癌癥基因模塊(P< 2.47e-5,配對t檢驗)。
除了基因模塊的拓撲結(jié)構(gòu)之外,團隊還研究了特征重要性得分。CGMega利用15維多組學特征作為輸入,并為每個特征,生成重要性分數(shù)。團隊從TCGA項目中,收集了乳腺癌的RNA-seq數(shù)據(jù),并鑒定了差異表達基因。DEGs的比例,在簇-3中較高。根據(jù)CGMega預測,Hi-C與其他活性調(diào)控元件一起,對這些基因具有共同作用。
基于特征重要性得分,團隊提出代表性特征(RFs),作為重要性得分排名靠前的特征。團隊重點關注BRCA1和BRCA2的基因模塊,這是乳腺癌中常見的基因。團隊觀察到,它們的基因模塊之間的拓撲差異。簡而言之,BRCA1是一種在DDR的多個階段起作用的多效性DNA損傷反應(DDR)蛋白,也被發(fā)現(xiàn)與另外20個基因廣泛相關。相比之下,BRCA2作為同源重組(HR)核心機制的介質(zhì),通過直接介導HR修復的重要基因ROCK2,與其他基因連接。基于TCGA項目的基因表達數(shù)據(jù),團隊發(fā)現(xiàn),ROCK2在乳腺腫瘤供體中,與BRCA2表達呈正相關,而在正常乳腺組織中,沒有這種相關性。BRCA2和ROCK2在乳腺癌中的共表達,表明BRCA2抑制劑在腫瘤發(fā)生中的聯(lián)合作用,這可能指導BRCA2抑制劑對腫瘤細胞的作用增強。研究結(jié)果表明,BRCA2和ROCK2抑制劑聯(lián)合治療24小時后抑制MCF7腫瘤細胞,比單獨使用BRCA2抑制劑更有效。這是一種增強BRCA2抑制劑敏感性的潛在策略。此外,SNV是BRCA1和BRCA2的RF。團隊還觀察到一個由BRCA1基因模塊和BRCA2基因模塊通過TP53、SMAD3和XPO1三個共享基因組合的高階基因模塊。綜上所述,這些適應癥,意味著CGMega能夠檢測具有多組學特征的可解釋和高階基因模塊。
乳腺癌細胞系中的基因模塊。
研究結(jié)論
CGMega與其他方法的主要區(qū)別在于:(1)與現(xiàn)有方法相比,CGMega在捕獲3D基因組結(jié)構(gòu)方面,具有先進的能力,這已被廣泛證明,是癌癥研究的新視角。(2)CGMega使用GNNExplainer40,解釋癌癥基因預測的促成因素。(3)CGMega顯示了不同癌癥之間的知識可轉(zhuǎn)移性。研究結(jié)果證明了,CGMega在不同癌癥類型上的可轉(zhuǎn)移性,這是本研究的一個重要方面。
除了CGMega的這些優(yōu)點外,團隊還對Hi-C數(shù)據(jù)與其他組學數(shù)據(jù)的整合方法,進行了全面評估,并證明了:(1)圖結(jié)構(gòu)在整合多組學信息方面是先進的,特別是對于分子信號和基因關系組合;(2)使用SVD將Hi-C數(shù)據(jù)編碼為基因特征,優(yōu)于將Hi-C數(shù)據(jù)作為基因連鎖進行測量。
CGMega在乳腺癌細胞系和AML患者中的應用,有助于發(fā)現(xiàn):(1)癌癥基因模塊廣泛且組織良好,包括以癌癥基因為中心的模式和非癌癥基因中心模式;(2)癌癥基因(已知的癌癥基因和預測的癌癥基因)往往富集在一個模塊中,表明癌癥基因在腫瘤發(fā)生中,具有復雜的相互作用;(3)除了這些眾所周知的癌癥基因外,還有一些樞紐基因位于癌癥基因模塊的中心,或存在于數(shù)十個癌癥基因模塊中。此外,CGMega在乳腺細胞系(AUPRC = 0.9140)和AML患者(平均AUPRC=0.8528)中的良好表現(xiàn)表明:(1) CGMega對細胞系和供體樣本,以及實體瘤和液體腫瘤研究均表現(xiàn)出療效;(2)CGMega對于缺少分子特征的輸入是靈活的。這表明,團隊的框架可能適用于其他類似的任務。
聲明:本文版權歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息,如作者信息標記有誤,或侵犯您的版權,請聯(lián)系我們,我們將在及時修改或刪除內(nèi)容,聯(lián)系郵箱:marketing@360worldcare.com
手機網(wǎng)站
醫(yī)療保險公司
臨床專科
消化內(nèi)科
呼吸內(nèi)科
神經(jīng)內(nèi)科
心內(nèi)科
風濕免疫科
普外科
骨科
神經(jīng)外科
血管外科
消化外科
婦科
產(chǎn)科
小兒內(nèi)科
兒童保健科
整形美容
皮膚美容
口腔美容
口腔科
口腔正畸科
生殖醫(yī)學科
泌尿外科
小兒外科
推薦名醫(yī)
高之憲
鐘南山
張文宏
胡大一
車曉明
凌鋒
曹子昂
王春生
楊尹默
王蕾
王志軍
賈兵
郭衛(wèi)
葉曉健
黃健
汪朔
鮑永珍
馬杰
王家東
孫玉強
沈坤煒
朱正綱
王秋根
鄭億慶
齊雋
李健文
毛穎
李士其
陳世益
秦新裕
朱振安
盧曉峰
陸舜
享醫(yī)(上海)網(wǎng)絡科技有限公司 版權所有 ?2015-2024
版權申明
滬ICP備15042088號
滬公網(wǎng)安備 31010102003241號
保險產(chǎn)品內(nèi)容由上海銘祥保險代理有限公司提供