11 年
手机商铺
公司新闻/正文
1061 人阅读发布时间:2020-06-19 17:53
慢性肝病会诱发肝纤维化并进一步发展为肝硬化,最终导致肝癌的发生。肝组织活检目前仍然是评价肝纤维化程度的金标准,但是由于组织活检具有创伤性、样本误差等问题导致在临床上的应用受到限制,因此非创伤性的准确可靠的诊断指标亟需开发。贾伟教授团队与上海中医药大学刘平教授团队合作通过对两个研究队列受试者进行血清靶向定量代谢组学研究,筛选出 4 个代谢物指标并建立机器学习模型进行疾病诊断,相关成果于 2020 年 6 月 5 日在《BMC Medicine》期刊在线发表。

血清代谢物筛选及诊断模型选择
队列一纳入 1006 名受试者,其中 504 名慢乙肝患者(CLD),502 例健康对照。队列二纳入 390 例受试者,其中 300 例慢乙肝患者,90例健康对照。除了失代偿性肝硬化患者,其他疾病患者均接受肝组织活检检测进行疾病分期判断。
我们采用靶向代谢组学定量测定血液样本中 24 种胆汁酸、42 种游离脂肪酸、32 种氨基酸,其中 26 种代谢物在CLD vs正常、肝纤维化vs肝硬化、肝纤维化不同阶段中存在显著差异。根据 LASSO 算法和随机森林(RF)算法共筛选出 4 种代谢物,分别为反式亚油酸(linoelaidic acid,C18:2,n6t)、牛磺胆酸(taurocholate,TCA)、酪氨酸(tyrosine,Tyr)和缬氨酸(valine,Val)。此外,还发现 Tyr/Val 比值可以进一步提高分类性能以及年龄也是区分纤维化和肝硬化以及纤维化不同程度的危险因素。4 种代谢物与纤维化分期、坏死性炎症、CPA、AST、ALT、AST/ALT、PLT、FIB-4、APRI 进行 Spearman 相关分析。四个代谢物(包括 Tyr/Val)比现有临床指标与纤维化程度均呈现更强的相关性。
为了确定一个合适的分类模型,我们在队列一中采用 10 倍交叉验证(CV)来比较代谢物构建的 RF 模型和两个线性模型(logistic 回归(LR)、线性判别分析(LDA))以及与临床指数、APRI、AST/ALT、FIB-4 之间的诊断能力。以 CV-受试者工作特征曲线(ROC)下的面积(CV- AUROC)和CV-精确率曲线(PR)下的面积(CV- AUPR)作为评价指标。结果显示,诊断区分 CLD 和健康组, APRI、LR、LDA 和 RF 模型的 AUROCs 和 AUPR 都很高,但 RF 模型具有最强的分类性能。在诊断纤维化和肝硬化、早期肝纤维化(S0-2)与晚期肝纤维化(S3-4)上,RF 模型的 CV-AUROC 和 CV-AUPR 优于其他方法。经过综合比较,基于决策树的集成学习算法 RF 表现出更好的分类性能。
模型的构建
模型一:诊断 CLD 患者与健康组
CLD 患者中反式亚油酸浓度(C18:2,n6t)显著降低,而TCA、Tyr、Tyr/Val水平均高于对照组。队列一中利用这四种代谢物标志物建立 RF 模型进行 CLD 患者和 NC 患者诊断,采用袋外数据(out of bag, OOB)进行 RF 模型评估。该模型 AUROC 和 AUPR 分别达到 0.997 和 0.994,明显高于 APRI (AUROC=0.973, p<0.001), FIB-4 (AUROC=0.848, p<0.001)和 AST/ALT (AUROC=0.665, p<0.001)。其中,C18:2,n6t 浓度越低、TCA 浓度越高意味着 CLD 的风险越高。
基于 OOB 概率预测,采用 logit 函数计算模型一 RF 得分。瀑布图显示 RF 评分从 NC(较低的 RF 得分)到 CLD(较高的 RF 得分)有明显的上升趋势,两组间 RF 得分存在显著差异(p<0.001)。在训练集 cutoff 值为 0.434 时,CLD 患者诊断敏感性为 98.4%,特异性为 99%。当 RF 模型中使用 Youden index 产生最 jia 临界值的敏感性和特异性优于 AST/ALT、APRI 和 FIB-4。
模型二:区分 CLD 中肝纤维化患者和肝硬化患者
利用四种代谢物标志物和年龄建立 RF 预测模型以预测 CLD 肝硬化患者与非肝硬化患者。基于 OOB 预测,该模型 AUROC 为 0.941,AUPR 为 0.87,优于APRI (AUROC=0.698, p<0.001) 、AST/ALT (AUROC=0.815, p<0.001)、FIB-4 (AUROC=0.869, p<0.001)。决策树显示Tyr/Val、酪氨酸、反式亚油酸水平越高,肝硬化风险就越高。RF 模型临界值为 0.01 对肝硬化与纤维化有效区分时,模型敏感性为 87.0%,特异性 90.4%。对 HBV-DNA 水平、坏死性炎症程度、HBeAb、HBeAg、BMI、血小板(PLT)、肝功(如凝血酶原时间、白蛋白、直接胆红素、间接胆红素)和药物(恩替卡韦)进行校正后,RF 得分依然显著 (p < 0.001),且敏感性和特异性均显著优于 AST/ALT、APRI 和 FIB-4。
模型三:CLD 中纤维化的分级
在本研究将肝纤维化 0-2 期归为早期纤维化(S0-2),3-4 期被定义为晚期纤维化(S3-4)。根据年龄和四种代谢物标志物建立模型三用于区分早期纤维化和晚期纤维化,模型 AUROC 为 0.918 和 AUPR 为 0.892,比 APRI (AUROC=0.647, p<0.001),AST/ALT(AUROC=0.714, p<0.001),FIB-4(AUROC=0.802, p<0.001)更优。决策树显示,Tyr/Val、Tyr、年龄和 TCA 越高,晚期肝纤维化的风险越高。
logit 诊断 RF 得分临界值为 -0.115 可将早期纤维化患者与晚期纤维化患者区分开来,该模型敏感性为 86.7%,特异性为 90.5%。对 HBV-DNA 水平、坏死性炎症程度、HBeAb、HBeAg、肝功能、血小板、BMI 和药物(恩替卡韦) 进行校正后,RF 得分仍有统计学意义 (p < 0.001),且敏感性和特异性均显著优于 AST/ALT、APRI 和 FIB-4。


在独立 HBV 队列(队列二)中验证预测模型
队列二中的样本进行了相同的代谢组学研究,获得与队列一相似的代谢物浓度结果。对于 CLD 诊断,与 APRI (AUROC=0.879, AUPR=0.958)、AST/ALT(AUROC=0.603, AUPR=0.849)、FIB-4 (AUROC=0.707, AUPR=0.897) 相比,构建的模型一依然具有更强分类性能,其 AUROC 为 0.977 和 AUPR 为 0.993。此外,使用队列一中模型一的cutoff值进行分析,结果显示队列二的 RF 得分诊断CLD 的敏感性为 92.2%,特异性为 94.4%。模型二区分肝硬化患者和纤维化患者的 AUROC 为 0.844 和 AUPR 为 0.827,比 APRI (AUROC=0.608, p<0.001)、AST/ALT (AUROC=0.684, p<0.001)、 FIB-4 (AUROC=0.758, p<0.001)更优。使用队列一中模型二的 cutoff 值进行分析,模型二 RF 得分区分肝硬化患者和纤维化患者的敏感性为 71.8%,特异性为 81.6%。同样,模型三区分纤维化阶段的AUROC 为 0.807 和 AUPR 为 0.817,比 APRI (AUROC=0.595, p<0.001)、AST/ALT (AUROC=0.667, p<0.001)、FIB-4 (AUROC=0.739, p= 0.01)更优。模型三 RF 得分区分纤维化 S0-2 期和 S3-4 期的敏感性为 72.9%,特异性为 76.1%。
此外,引入重分类改善指标(NRI)和积分判别改进(IDI)来量化模型对现有临床指标诊断的改进。对不同分类目标(健康与 CLD、肝纤维化与肝硬化、早期肝纤维化与晚期肝纤维化)分析中, 与 FIB-4、APRI、AST/ALT 相比,RF 模型的 NRI 和 IDI 均得到阳性结果,说明代谢物建立的模型具有更好的分类表现。
S0-2、S3 和 S4 多分类诊断
除了进行二分类分析外,我们还进一步分析了筛选到的潜在标志物是否可以对 CLD 患者进行多分类分析。于是重新构建 RF 模型,分别对 APRI、AST/ALT 和 FIB-4 进行多元回归以诊断队列 1 中 S0-2 期患者、S3 期患者和 S4 期患者。在队列一中,与 APRI (AUROC=0.790, AUPR=0.658)、AST/ALT (AUROC=0.817, AUPR=0.688)、FIB-4 (AUROC=0.858, AUPR=0.774)相比,预测模型 AUROC 为0.944,AUPR 为 0.908。队列 2 验证集中,与 APRI (AUROC=0.790, AUPR=0.608)、AST/ALT (AUROC=0.772, AUPR=0.597)、FIB-4 (AUROC=0.816, AUPR=0.699)相比,预测模型 AUROC 为0.841 (0.799-0.885),AUPR 为 0.748(0.674-0.81)。比较各模型的诊断表现,结果显示代谢物多分类模型优于其他方法。
小结
随着世界范围内 CLD 患病率的上升,对该病严重程度进行准确可靠评估对治疗方式选择和纵向监测越来越重要。越来越多的研究尝试开发可替代肝活检的无创 CLD 诊断工具,例如目前已经被广泛报道的 AST/ALT、APRI 和 FIB-4。非侵入性评估方法方便同一个患者定期连续监测(例如每 3 个月或每半年),动态反映该患者的肝纤维化和肝硬化变化状况,可用于疗效监测,预后判断,更适合临床应用。本研究确定了一组代谢物标志物,包括反式亚油酸、TCA、Tyr,以及与 CLD 进展高度相关的 Tyr/Val。本研究中,首先通过单变量、LASSO 和 RF 分析,确定显著差异代谢物作为候选标记物,并构建了相应的 RF 预测模型。虽然模型在验证集中 AUROC 不如训练集 AUROC 高,依然获得了相对较好的 AUROC (均为> 0.8)。此外,当机器学习应用于生物医学研究时,外部验证 / 准确性测试下降是一个常见的事实,不过几种代谢物的 AUROC 和 AUPR 仍明显大于 AST/ALT、APRI 和 FIB-4,表明代谢物模型具有更好的预测价值。
本研究也存在几个局限性:
(1)药物使用是本研究中的混杂因素,虽然对药物使用校正后没有改变,但仍需要更大规模的研究来进一步评估;
(2)本研究中 HBV 感染是 CLD 发生的唯 yi 或主要原因且研究对象均为中国人,因此,对于其他病因或其他种族/民族群体还需进一步验证;
(3)除了横断面研究,还应进行纵向研究,特别是用于区分早期和晚期肝纤维化。
综上所述,我们通过靶向代谢组学分析,确定了四种代谢标志物可以准确区分 CLD 患者与健康者,并可区分不同阶段肝纤维化。非侵入性代谢物诊断性能优于 FIB-4、AST/ALT、APRI。如果在未来的研究中得到验证,那么这种方式将有助于减少不必要的肝活检来确定患者有无显著纤维化,评估 CLD 进展程度。
参考文献
Guoxiang Xie, Xiaoning Wang , et al., Serum metabolite profiles are associated with the presence of advanced liver fibrosis in Chinese patients with chronic hepatitis B viral infection. BMC Medicine, (2020) 18:144. https://doi.org/10.1186/s12916-020-01595-w.
原文下载,请长按识别下方二维码

精彩推荐
1. 贾伟/李后开: “肠道菌-胆汁酸-脑”代谢轴可能参与阿尔茨海默病和肝性脑病的发病机制
2. 贾伟教授:菌群检测到干预的产业闭环迟迟未形成,有2大原因!
3. 肠·道 | 贾伟:肝病肠治?且看肠道细菌如何对肝病推波助澜!
4. 绘谱导读︱5月代谢组学文献精选
5. 绘谱学堂 | 劲爆6月药物代谢组学专场抢先知
6. 引领行业 │ 聚焦麦特绘谱代谢组学整体解决方案
微信公众号:麦特绘谱
Tel:400-867-2686
Email : marketing@metaboprofile.com
Web: www.metaboprofile.com