楊曉峰、魏亮研究組和合作者構建并驗證了膀胱癌體細胞突變驅動的代謝相關基因預后模型
膀胱癌(BLCA)是泌尿系統中侵襲性最高的惡性腫瘤之一,具有高復發率和高死亡率的特點,盡管方法多樣且均取得巨大進步,但仍有超過半數的患者治療后會出現復發或進展,如何按照預后準確進行患者分群,并提早調整治療策略,是臨床函待解決的難題。改變現狀的方法之一應是研究和納入更多新的有價值的預后因子,來優化我們的預后預測評價體系,尤其是篩選出高危病人并提早調整治療方案,同時也有望找到新的治療靶點。因此,研究新型分子生物標記物在膀胱癌的篩查、診治、預后中有著巨大的潛力和價值。
近些年研究表明癌細胞普遍存在代謝改變,以維持其在不利環境下的增殖和演進,主要表現為:葡萄糖代謝以有氧糖酵解為主,氧化磷酸化減弱,磷酸戊糖代謝途徑增強,谷氨酰胺分解代謝活躍,脂肪酸從頭合成及β-氧化反應活躍等,這些代謝改變被稱為代謝重編程( Metabolic reprogramming )。限制或改變上述代謝重編程過程可以抑制腫瘤細胞的增殖,促進腫瘤細胞死亡,調節代謝重編程可作為腫瘤靶向治療的新策略。而基因改變往往會通過重編程代謝導致癌癥進展,它是表觀遺傳、氧化還原狀態、外泌體、腫瘤相關成纖維細胞(CAF)和免疫細胞改變的重要原因,這也使得癌癥代謝及其相關基因成為研究的熱點。
2023年5月楊曉峰、魏亮研究組和合作者撰寫的論文Construction and validation of a prognostic model of metabolism-related genes driven by somatic mutation in bladder cancer被Frontiers in Bioscience-Landmark雜志錄用。本研究通過綜合生物信息學分析,初步建立并驗證了一個新的預后預測模型,揭示了體細胞突變驅動的代謝相關基因在膀胱癌中的表達、預后價值和功能,并預測了膀胱癌免疫治療、化療療效的潛在標記物。另外,通過單細胞數據分析我們發掘了生物標志物隨上皮細胞狀態的變化發生表達量的改變,并據此鑒定出影響膀胱癌預后和需要我們深入研究的兩個關鍵上皮細胞亞群。
1.差異表達的代謝相關基因的篩選和功能富集分析
本研究基于TCGA數據庫篩選到201個差異表達代謝相關基因(DEMRGs),其中93個代謝相關基因表達上調,108個代謝相關基因表達下調。功能富集分析得到477個GO BP,47個GO CC,178個GO MF,包括酒精代謝過程、細胞修飾氨基酸代謝過程、跨膜轉運體復合物、轉運體復合物、金屬離子跨膜轉運體活性、離子通道活性等。富集到226條KEGG通路,包括cGMP-PKG信號通路、嘌呤代謝、胰腺分泌、花生四烯酸代謝、色氨酸代謝等。(圖1)

圖1 DEMRGs的篩選和功能富集分析
2.風險模型的構建
根據TCGA體細胞突變數據,篩選出24個突變頻率>為3%的DEMRGs。采用單因素和多因素COX分析,鑒定出5個膀胱的預后生物標志物(FASN、ATP8B2、ABCC4、ATP2B4、MTHFD1L)。然后我們繪制5個預后相關基因的ROC曲線,檢驗模型基因的預后預測能力,結果顯示單個基因的AUC均大于0.7,但利用這5個基因構建的預測模型,ROC曲線的AUC為0.97,證實了模型的有效性和準確性更高,優于單個基因的預測能力。(圖2)

圖2 膀胱癌中的模型基因的分析
3.預后風險模型的驗證
繪制了兩組模型基因表達的風險曲線和熱圖。ABCC4在低危組的表達量較高,且HR <為1,提示它可能是預測患者預后的一個重要因素。而FASN、ATP8B2、ATP2B4、MTHFD1L為HR > 1,在高危組中高表達。Kaplan-Meier曲線顯示,高危組患者的生存率低于低危組。ROC曲線顯示1-5年的auc均為>0.6。隨后,在測試集和驗證集中評估風險模型的預后。在測試集、驗證集和訓練集中,基因表達模式是一致的。另外,計算不同組的突變頻率,所有突變樣本中生物標志物的突變頻率均大于8%,高危組的突變類型增加。

圖3 預后基因風險評分系統的驗證
4.風險模型的獨立性預測
相關性結果顯示,預后風險評分和臨床特征之間存在顯著性差異。T期K-M生存曲線結果顯示,兩組在病理T2、T3、T4期生存差異有統計學意義。除性別外,所有臨床因素的p值均小于0.05。采用多變量Cox分析,將riskScore、t病理、年齡和n病理作為獨立的預后指標。同時,列線圖和校準曲線所示,列線圖C指數為0.7287,說明該模型具有較好的預測能力。(圖4)

圖4 膀胱癌患者5個預后基因的臨床價值評估
5.免疫微環境、免疫檢查點及抗癌藥物敏感性分析
我們分析了這些相關性,以證明免疫微環境中細胞浸潤的相互作用。對22個免疫細胞群的分析發現,4個免疫細胞的比例有顯著差異。這4種免疫細胞分別是B細胞記憶細胞、巨噬細胞M0、靜止的樹突狀細胞和T細胞。K-M生存曲線分析顯示,兩組LGALS9、PDCD1和TIGHT的免疫檢查點有顯著差異。并對其表達水平進行分析,結果顯示兩組間三個免疫檢查點的表達水平存在顯著差異,低危組LGALS9顯著升高,PDCD1缺失,TIGHT明顯降低。相關分析結果顯示,風險評分與PDCD1、TIGIF呈顯著正相關,風險評分與LGALS9呈負相關。(圖5)
另外,在198種抗癌藥物反應中,有146種藥物在兩個風險組之間存在顯著差異。高危組患者對42種藥物更為敏感,包括5-Fluorouracil_1073、Camptothecin_1003、Docetaxel_1819等。而低危組患者對104種藥物更為敏感,包括Cisplatin_1005、Epirubicin_1511、Gemcitabine_1190、Vinblastine_1004等。

圖5免疫微環境和免疫檢查點的分析
6.膀胱癌中生物標志物的單細胞分析
通過scRNA-seq數據分析,對核心細胞進行篩。ǔ2000個表達水平差異較大的基因,以便進行后續分析。PCA結果顯示,樣本細胞的總體分布相似,沒有離群值樣本,共篩選了15個主成分(p<0.05)用于后續分析。另外,所有核心細胞的P值均小于0.05,因此我們使用所有核心細胞進行分析。聚類結果表明,核心細胞被分離成10個主要的不同的聚類。并對差異標記基因進行鑒定,并繪制每個聚類中前10個標記基因的表達熱圖。這些集群包括兩種帶有上皮細胞和DC細胞的細胞。由于采集的樣本為上皮細胞,DC細胞所占比例相對較。虼巳〕鯠C細胞進行后續分析。將核心細胞投射到一個根和兩個分支上,構建單個細胞軌跡圖。所有生物瘤的表達情況均發生了變化。將單細胞GSE135337數據集中的GSM4006644樣本的核心細胞根據其基因表達譜分為兩個聚類。這些聚類被命名為低表達組(聚類1)和高表達組(聚類2)。然后,統計兩組之間的細胞類型。聚類2和聚類3在兩組中差異最大。此外,簇2和簇3的細胞分別受到其他簇細胞的影響。(圖6)

圖6 單細胞RNA測序分析
7.驗證基因表達水平
本研究采用qRT-PCR進一步驗證了10例患者的生物標志物(ABCC4、FASN、FASN、ATP2B4、ATP8B2、MTHFD1L)在正常對照組和癌組織中的表達水平。qRT-PCR分析結果顯示,這些基因的表達水平存在顯著性差異。癌組織中FASN和MTHFD1L的mRNA水平顯著升高,而ABCC4、ATP2B4和ATP8B2的mRNA水平顯著降低。(圖7)

圖7 qRT-PCR分析ABCC4、FASN、ATP2B4、ATP8B2和MTHFD1L的mRNA水平
綜上所述,本研究構建了一種基于與代謝重編程相關的臨床和分子因素的新預后模型,有可能改善膀胱癌患者獨立預后的預測和管理,從而獲得更好的治療結果和生存率。本研究的主要優勢在于利用傳統轉錄組數據和單細胞數據聯合分析鑒定體細胞突變驅動的代謝相關基因在膀胱癌中的生物學意義。
本項研究第一作者是c7c7.app博士魏亮,而c7c7.app第一醫院楊曉峰作為該論文的通訊作者。本研究工作獲得山西省基礎研究計劃項目面上項目“卡介苗無反應非肌層浸潤性膀胱癌單細胞免疫組庫信息學特征的研究(編號:20210302124412)”的經費支持。