又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第1张

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第2张

导语

今天给同学们分享一篇非肿瘤运用WGCNA和机器学习筛选关键基因并做泛癌分析的生信文章“Analysis and Experimental Validation of Rheumatoid Arthritis Innate Immunity Gene CYFIP2 and Pan-Cancer”,这篇文章于2022年7月11日发表在Front Immunol期刊上,影响因子为8.786。类风湿性关节炎(RA)是一种慢性、异质性自身免疫性疾病。其高致残率对社会和个人造成严重影响,但目前仍缺乏有效可靠的RA诊断标志物和治疗靶点。但作者的结果显示,CYFIP2与各种肿瘤患者的预后、免疫细胞浸润程度以及TMB、MSI等指标密切相关,提示该基因可能是一种潜在的干预手段RA和肿瘤等人类疾病的靶点。

1. DEG筛选和数据预处理

数据在箱形图中标准化,其中不同的颜色代表不同的数据集,行代表样本,列代表样本中的基因表达值(图1A)。图1B显示了多个数据集在批量移除之前的PCA结果,其中不同的颜色代表不同的数据集。如图所示,三个数据集没有任何交集。图1C显示了批量移除后的PCA结果图。如图所示,三个数据集的交集可以作为一批数据进行后续分析。在P<0.05和log2FC>0.5,891个基因被鉴定为DEGs,其中427个基因上调,464个基因下调。图1D显示了DEG的火山图以及前50个基因的热图(图1E)。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第3张

图1 DEG的数据预处理

2. WGCNA分析

从GEO数据中检索出GSE1919和GSE55457数据集,15个正常样本和18个RA样本对样本进行聚类,通过设置阈值排除明显异常的样本,如图2A所示。然后,如图2B所示,当R2>0.9且平均连通性较高时,作者将软阈值设置为7。在使用0.25聚类高度限制(图2C)合并强关联模块后,确定了24个模块以供进一步研究。准备好的和合并的模块最终显示在聚类树下(图2D)。接下来检查模块之间的相关性,结果显示它们之间没有显着关联(图2E)。通过模块内的转录相关分析证明了模块描述的可靠性,这表明模块之间没有实质性联系(图2F)。ME值与临床特征之间的正面相关性用于研究模块与临床症状之间的联系。blue模块与正常值正相关,与RA负相关,而turquoise模块与正常值负相关并与RA呈正相关(图2G)。确定了具有临床意义的模块。结果表明,在对照MM与GS散点图(图2H)和RAMM与GS散点图(图2I)中,blue和turquoise模块与RA高度相关。进一步检查了两个模块中的所有基因。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第4张

图2 WGCNA共表达网络的构建

3. 关键模块基因的DEG和功能分析

在使用维恩图交集关键模块基因和DEG基因后,作者发现了490个交集基因(图3A)。作者进行了功能分析,以了解更多关于模块中DEG基因的生物学功能。DO分析结果显示,这些DEG与淋巴细胞白血病、肝炎、生殖细胞癌和造血系统疾病有关(图3B)。GO富集分析表明,模块DEG基因具有T细胞激活、细胞间粘附调控、细胞激活正调控、质膜外侧、膜筏、膜微域、细胞因子受体结合、抗原结合、免疫等功能。受体活性(图3C)。KEGG分析与细胞因子-细胞因子受体相互作用、趋化因子信号通路和人类免疫缺陷病毒1型感染相关(图3D)。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第5张

图3 与DEG合并的关键模块基因的功能分析

4. 特征基因的选择

作者使用了三种机器算法来识别特征基因,LASSO回归分析从具有统计学意义的单变量中选择19个预测基因(图4C)和随机森林结合特征选择来确定错误率、分类树数量(图4D、E)和31个具有相对重要性的基因之间的关系。作者使用维恩图找到四个交集的基因,使用上面讨论的三种方法的交集(图4F)。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第6张

图4 机器学习

5. 特定基因表达的验证

作者使用GSE1919和GSE55447数据证实了这四种基因在RA中的表达,并发现BTN3A2、CYFIP2、ST8SIA1和TYMS在RA中都显着升高。此外,验证数据集(GSE48780和GSE55235)表明BTN3A2、CYFIP2、ST8SIA1和TYMS在RA中大量表达。还检查了基因相关性,如图5所示,BTN3A2、ST8SIA1、TYMS和CYFIP2呈正相关,表明这四个基因具有显着的功能相似性。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第7张

图5 性状基因之间的相关性

6. 基因相互作用分析

作者使用GeneMANIA数据库为特征基因创建了一个PPI网络(图6A)。为了进一步研究特征基因的功能,对20个基因进行了GO/KEGG分析。肌动蛋白聚合或解聚、Rac蛋白信号转导和Arp2/3复合物介导的肌动蛋白成核控制是该数据集中最丰富的生物过程。此外,RhoGTPasebinding、RasGTPasebinding、smallGTPasebinding和RacGTPasebinding与MF相关(图6B)。根据KEGG分析,主要的富集途径是肌动蛋白细胞骨架的调节、致病性大肠杆菌感染和沙门氏菌感染(图6C)。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第8张

图6 特征基因的交互作用分析

7. RA诊断柱线图的建模和测试

作者使用Rms包(图7A)为特征基因(BTN3A2、CYFIP2、ST8SIA1和TYMS)构建了RA诊断柱线图模型,并使用校准曲线评估了它们的预测能力。校准曲线显示真实和预测的RA风险之间的差异非常小,表明柱线图模型RA非常准确(图7B)。还可以使用ROC曲线分析(图7C)确认模型的正确性。“柱线图”曲线高于决策曲线分析(DCA)中的灰线,“BTN3A2、CYFIP2、ST8SIA1和TYMS”曲线暗示患者可以从高风险的柱线图模型中获益0到1的阈值。柱线图模型提供了比“BTN3A2、CYFIP2、ST8SIA1和TYMS”曲线更大的临床益处(图7D)。验证集(GSE48780和GSE55235)中的验证也证实了这些发现(图7E、F)。为了进一步验证BTN3A2、CYFIP2、ST8SIA1和TYMS的诊断价值,作者使用了ROC分析。发现BTN3A2、CYFIP2、ST8SIA1和TYMS具有相似的AUC值(图7G)。验证数据集(GSE48780和GSE55235)也证实了以下发现:TYMS、BTN3A2、CYFIP2、ST8SIA1(图7H)。这些发现意味着所有主要基因都与RA相关。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第9张

图7 RA诊断柱线图模型的构建与验证

8. 使用免疫相关性的ssGSEA分析在RA组和健康对照中的免疫浸润

使用ssGSEA进一步研究了RA患者和健康对照之间的免疫浸润关联。结果显示,排除无统计学意义的后,肥大细胞和RA的免疫细胞浸润低于对照组,其余RA组的免疫细胞浸润和免疫相关通路均高于RA组对照组(图8A)。作者知道CYFIP2与aDC、CCR、CD8+T细胞、检查点、溶细胞活性、DC、炎症促进、MHCI类、中性粒细胞、T细胞共抑制、T细胞共刺激、Tfh、Th1细胞相关、Th2细胞、TIL和I型IFN反应显着正相关,使用“corrplot”包计算特征基因之间的相关性。BTN3A2与APC共刺激呈负相关。CD8+T细胞、细胞溶解活性、iDC、促进炎症、Tfh、TIL和I型IFN反应均与ST8SIA1具有强正相关性(图8B)。这些特征基因可能在RA的进展过程中调节免疫过程。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第10张

图8 RA与免疫之间的相关性

9. CYFIP2和ST8SIA1在CIA小鼠滑膜组织中的表达增加

为了验证CYFIP2和ST8SIA1在RA滑膜中的表达,作者用IHC处理小鼠滑膜,发现CYFIP2和ST8SIA1CIA小鼠在滑膜中高表达(图9)。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第11张

图9 CYFIP2和ST8SIA1在CIA小鼠滑膜中的表达

10. 泛癌CYFIP2表达

从InnateDB数据库中检索免疫基因,并将四个特征基因相交以产生两个交集基因(CYFIP2、ST8SIA1)。由于免疫反应不仅在RA中而且在癌症中都至关重要,因此作者使用交集的免疫基因来查看这两种疾病之间是否存在任何联系。CYFIP2在TCGA数据中被鉴定为在BRCA、CHOL、HNSC、PRAD、THCA中高表达,在BLCA、BRCA、COAD、ESCA、GBM、KICH、KIRC、KIRP、LUAD、LUSC和PAAD中低表达(图10A)。作者还从GTEx数据库下载了正常组织数据,发现CYFIP2在BRCA、CHOL、COAD、DLBC、ESCA、HNSC、OV、PAAD、PCPG、PRAD、READ、SKCM、TGCT、THCA和THYM中强烈表达,而它在BLCA、CESC、GBM、KICH、KIRC、KIRP、LGG、LIHC和LUAD中弱表达(图10B)。如数据所示,CYFIP2在细胞系中表达(图10C)。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第12张

图10 CYFIP2表达

11. CYFIP2在泛癌中的预后价值

作者研究了CYFIP2表达与泛癌患者预后之间的关系,包括总生存期(OS)、疾病特异性生存期(DSS)和无进展生存期(PFS)。在OS分析中,33种肿瘤的cox回归显示CYFIP2表达与六种癌症中的OS显着相关:KIRC、LGG、PAAD、SKCM和THYM作为保护因素,UCEC作为风险因素(图11A)。在PFS研究中,33种肿瘤的cox回归显示CYFIP2表达与6种恶性肿瘤的PFS显着相关,在BRCA、HNSC、KIRC、LGG和PAAD中具有保护因素,在UCEC中具有风险因素(图11B)。在DSS分析中,33种肿瘤的Cox回归显示CYFIP2表达与5种癌症中的DSS显着相关:BLCA、KIRC、LGG和PAAD是保护因素,而UCEC是风险因素(图11C)。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第13张

图11 CYFIP2与泛癌预后的相关性

12. 免疫浸润分析

为了更多地了解CYFIP2在肿瘤免疫反应中的作用,使用TIMER数据库计算了CYFIP2表达与不同水平的免疫细胞浸润之间的联系。根据研究结果,18个肿瘤中的T细胞CD8+、20个肿瘤中的T细胞CD4+、23个肿瘤中的中性粒细胞、19个肿瘤中的髓样树突状细胞、12个肿瘤中的髓样树突状细胞和23个恶性肿瘤中的B细胞被证明是紧密相连。HNSC、LUSC、PAAD、SKCM、STAD、THCA和THYM显示出显着的正相关,而KICH和LGG显示出显着的负相关(图12A)。还使用xCELL算法(图12B)、QUANTISEQ算法(图12C)、MCPCOUNTER算法(图12D)和EPIC算法(图12E)证明了CYFIP2水平与入侵免疫细胞之间的联系。使用ESTIMATE算法计算基质评分和免疫评分的估计评分,结果显示免疫评分与13种癌症相关,而基质评分与16种肿瘤相关。其中,免疫评分与HNSC、LGG和STAD关系最为密切。HNSC、LGG和UVM与基质评分的相关性最强。CYFIP2水平和免疫检查点显示与一系列癌症高度相关,在UVM中主要呈正相关,在BLCA、BRCA、COAD、HNSC和PRAD中主要呈负相关,而在UVM中主要呈负相关。此外,在TMB研究中,发现CYFIP2与BRCA、COAD、KIRC、LGG、LIHC、LUAD、PAAD、SARC、STAD、THYM、UCEC和UVM呈负相关。在MSI分析中,CYFIP2与COAD、DLBC、KICH、SARC和STAD呈正相关和负相关。

又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!,第14张

图12 CYFIP2在肿瘤免疫反应中的作用

总结

为了探索免疫浸润与RA和泛癌之间关联的特定关键基因,作者进行了全面深入的分析,以分析相关基因和通路。作者发现的2个关键基因(CYFIP2和ST8SIA1)将拓宽对分子机制的认识,并为临床治疗带来更多潜在的治疗靶点,这也需要更多的研究来验证和开发。对于进一步的泛癌分析,CYFIP2被认为是RA和33种肿瘤中最有潜力的靶点,这可能为人类免疫相关疾病甚至癌症的治疗带来希望。对非肿瘤和泛癌分析感兴趣的老师,欢迎扫码咨询!

生信分析定制服务

请扫描下方二维码

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
白度搜_经验知识百科全书 » 又见非肿瘤泛癌分析!学会这个8+非肿瘤+泛癌+表达验证生信思路,发高分不是梦!

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情