近日,我校公共衛生學院曹紅艷副教授團隊依托煤炭環境致病與防治教育部重點實驗室、重大疾病風險評估山西省重點實驗室,在中國科學院1區TOP期刊British Journal of Cancer(IF 8.8)上發表論文“wMKL: multi-omics data integration enables novel cancer subtype identification via weight-boosted multi-kernel learning”,曹紅艷副教授為第一作者,密歇根州立大學統計概率系崔躍華教授為通訊作者。

腫瘤分子異質性是傳統腫瘤病理學不能準確分型的重要原因,多組學數據整合分子分型可為腫瘤分類分級和靶向治療提供重要科學依據。多組學數據存在高噪聲、數據冗余的特點,高噪聲一定程度上稀釋了原本很弱的分子特征信號,現有整合分型方法對分子特征信號的捕獲上存在不足。本研究聯合多種先驗特征信號,提出了加權多核學習多組學數據整合方法(weight-boosted Multi-Kernel Learning,wMKL),其分型準確性優于現有加權方法以及未加權方法。進一步將wMKL應用于乳頭狀腎細胞癌和肺腺癌多組學數據整合分子分型,識別出了具有顯著生存差異的分子亞型,不同亞型在腫瘤相關生物通路活性以及免疫細胞浸潤水平等方面皆存在顯著差異。wMKL方法的提出為多組學數據整合的腫瘤分子分型研究提供了新思路,同時,該方法亦能適用于其他異質性疾病的分子分型。wMKL的R軟件包發布在github網站(https://github.com/biostatcao/wMKL)。
曹紅艷副教授團隊多年開展多組學數據整合分子分型方法及其應用研究,發展了系列多組學數據整合分子分型方法,如分層多核學習(hierarchical multi-kernel learning, hMKL,Briefings in Bioinformatics, 2023)、基于共性結構的相似網絡融合(joint similarity network fusion, Joint-SNF, Computational and Structural Biotechnology Journal, 2022)、網絡增強核融合(Network Enhancement Fusion, ne-SNF, Computational and Structural Biotechnology Journal, 2021)等方法,為多組學數據整合分析提供了研究工具和新的分析方法。團隊所在學科流行病與衛生統計學是我校國家高水平公共衛生學院建設主干學科,近年來,聚焦統計遺傳與基因組學研究領域,進行了卓有成效的探索,為高水平公共衛生學院建設貢獻了力量。
原文鏈接:
https://www.nature.com/articles/s41416-024-02587-w