在新冠疫情肆虐的背景下,目前还没有可用的预后生物标志物来区分需要立即就医的病人并估计他们的相关死亡率。
近日,发表在《自然·机器智能》上的一篇研究利用来自中国武汉地区485名感染患者的血液样本数据库,确定了新冠肺炎死亡的关键预测生物标志物。
研究人员设计了一种基于最先进的可解释机器学习算法的数学建模方法来识别最具鉴别性的患者死亡率生物标志物。
在该研究中,机器学习工具选择了三个生物标志物,它们可以提前10天以上以90%以上的准确率预测单个患者的死亡率:乳酸脱氢酶(LDH)、淋巴细胞和超敏C反应蛋白水平(hs-CRP)。
特别是,相对高水平的LDH似乎在区分需要立即就医的绝大多数病例中发挥了关键作用。
乳酸脱氢酶(LDH或LD)是参与糖酵解和糖异生工程中催化乳酸和丙酮酸之间氧化还原反应的重要酶类。乳酸脱氢酶存在于机体所有组织细胞的胞质内,其中以肾脏含量较高。乳酸脱氢酶增高见于肝炎、肝硬化、肝癌、心肌梗死、横纹肌损伤、心肌炎、恶性肿瘤、肾病、肺梗死、巨幼细胞贫血、白血病、恶性淋巴瘤及妊娠等。
超敏C反应蛋白是血浆中的一种C反应蛋白,又称为高敏C反应蛋白。它是由肝脏合成的一种全身性炎症反应急性期的非特异性标志物, 是心血管事件危险最强有力的预测因子之一。
这一发现与当前医学知识一致,即高LDH水平与各种疾病的组织破坏有关,包括肺炎等肺部疾病。
总的来说,这篇文章提出了一个简单的、可操作的决策规则来快速预测高危患者,允许他们优先考虑并潜在地降低死亡率。
这个问题被表述为一个分类任务,输入基本信息,包括症状,血液样本和实验室测试的结果,包括肝功能、肾功能、凝血功能、电解质和炎症因子,这些信息取自普通、重症和危重病人,还有在检查期结束后,这些患者是否存活或死亡的信息。
通过优化,这个分类器的目的是揭示最关键的生物标志物,区分出即将面临风险的患者,从而减轻临床负担,潜在地降低死亡率。
在375名患者中,最常见的首发症状是发热(49.9%),其次是咳嗽(13.9%)、疲劳(3.7%)和呼吸困难(2.1%)。
患者年龄分布为58.83±16.46岁,其中男性占59.7%。流行病学史包括武汉居民(37.9%)、家庭聚集性(6.4%)和卫生工作者(1.9%)。
在随后分析的375例病例中,有201例从COVID-19中恢复并出院,其余174例死亡。
随后,在2020年2月19日至2020年2月24日期间,纳入110例新出院或死亡患者作为外部测试数据集进行分析。
所有485(375 + 110)名患者的最小、最大和中位随访时间(从入院到死亡或出院)分别为0天02:01:58(小时:分:秒)、35天04:05:54和11天04:15:36。
大多数患者在住院期间都会采集多次血液样本。然而,模型训练和测试仅使用来自最终样本的数据作为模型的输入,以评估疾病严重程度的关键生物标志物,区分需要立即医疗援助的患者,并准确匹配每个标签的相应特征。
表3总结了Multi-tree XGBoost模型的性能。结果表明,该模型能够准确识别患者的预后,无论患者入院时的初始诊断是什么。
值得注意的是,外部测试集的表现与培训和验证集相似,这表明该模型捕获了患者死亡率的关键生物标志物。
表3进一步强调了LDH作为患者死亡率的关键生物标志物的重要性。
平均而言,该研究的算法的准确率为90%,这进一步表明,该模型可以应用于任何血液样本,包括那些远远早于初级临床结果的样本。
平均而言,该模型可以利用所有患者的血样提前10天(外部检测组患者为11天)预测所有真实阳性患者的预后(图3b,c)。
该模型甚至可以提前18天预测,累计准确率达到90%以上(图3d,e)。
编译/前瞻经济学人APP资讯组
参考文献:
https://www.nature.com/articles/s42256-020-0180-7?utm_source=weibo&utm_medium=social&utm_term=s42256-020-0180-7
品牌、内容合作请点这里:寻求合作 ››
想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:
下载APP
关注微信号
扫一扫下载APP
与资深行业研究员/经济学家互动交流让您成为更懂趋势的人
违法和不良信息举报电话:400-068-7188 举报邮箱:service@qianzhan.com 在线反馈/投诉 中国互联网联合辟谣平台
Copyright © 1998-2025 深圳前瞻资讯股份有限公司 All rights reserved. 粤ICP备11021828号-2 增值电信业务经营许可证:粤B2-20130734