机器学习在检验医学应用的现状与思考
更新时间:2022/12/28 16:15:03 浏览次数:12611
文章来源:中华检验医学杂志, 2022,45(12) : 1197-1200
作者:沈立松 曾俊祥
摘要
近年来机器学习成为各研究领域的热点,利用机器学习可以实现由数据驱动向知识发现的转化,是今后实验室智能化的重要发展方向。机器学习在检验医学领域的应用目前已显示出了巨大潜力,但存在许多问题及挑战。推进机器学习技术的临床转化,实现在医学实验室的实用化、产业化,早日实现辅助临床决策的目标,是我们共同努力的方向。
我国检验医学近年来飞速发展,已经成为临床医疗体系中不可或缺的部分。医学检验实验室也飞速发展至当今现代化、自动化、集成化的实验室[1, 2]。日常工作产生的各类检验,数据不仅体量巨大、类型繁多,还有特征高维和冗余等特点[3]。但检验数据本身并不产生价值,如何分析和利用使其在疾病的诊断、分型、疗效评价和预后预测发挥临床价值才是关键[1,4]。在此背景下,利用机器学习(machine learning,ML)实现由数据驱动向知识发现转化的技术路径逐渐成为研究热点。
近年来美国食品药品监督管理局已批准了数十个基于人工智能医疗辅助设备[5],这代表着以ML为载体的医疗产品向临床转化迈出了重要一步。但迄今为止,此类产品都聚焦在肿瘤、放射及病理领域,在临床实验室中的应用还比较有限,相关研究也大多仍停留在初始阶段,较其他领域还存在较大差距[6]。
基于此,本期刊策划机器学习专刊,带来国内相关最新研究和报道,让读者了解ML的基本概念、方法,以及体会国内学者如何利用ML的方法在检验医学领域进行实践。希望以此加强在检验医学领域中ML的研究和应用,共同推进ML技术的临床转化,早日实现辅助临床决策的目标。
一、机器学习在检验医学的应用现状
根据ML的训练任务,可大致将ML分为三大类,即有监督学习、无监督学习和强化学习。
(一)有监督学习在检验医学的应用
有监督学习是指从有标签的训练数据中推导出预测函数。可简单理解为:给定数据,预测标签。典型算法包括:K最近邻、支持向量机、决策树和随机森林、梯度提升机、神经网络等。相对于传统的统计学分析方法(如线性回归等),此类方法对数据分布无线性要求,其自动发现并利用相关因素之间的交互效应及非线性关系,通过大量随机选择样本的方法平衡了样本误差的影响,由此产生的模型相比于仅以单个测试样本进行拟合的线性回归模型的结果更为可靠。由于检验参数绝大部分都为结构性数据,故大多数研究使用的都是有监督的ML方法。
1.有监督学习在诊断模型构建的应用:此类型可以参考本期刊登的《基于机器学习技术利用常规检验数据建立肺结核鉴别诊断方法》[7],作者通过回顾性分析,比较了支持向量机、随机森林、K最近邻、逻辑回归这4种机器学习算法在挖掘肺结核患者的常规检验数据构建模型的诊断效能,发现随机森林算法性能最佳,根据模型特征重要性排序,选择37个非特异性检验项目构成肺结核鉴别诊断模型。由于肺结核初诊患者往往在基层医疗卫生机构,而很多基层机构医疗水平相对落后,缺少肺结核检验技术,常造成疾病误诊和漏诊。本研究以最终诊断作为标签,利用多种有监督学习ML算法,通过常规检验指标的挖掘建立一种简单、有效和快速的肺结核鉴别诊断模型,具有较强的临床实用性,也从侧面展现了有监督学习在疾病诊断中的应用前景。
2.有监督学习在风险评估模型构建的应用:检验结果往往是构成临床疾病预后风险评估模型的重要参数[8]。ML通过对检验指标的深度挖掘,与患者的临床表型、个人史等整合建立风险预测模型,进行并发症的预测,提供有针对性的风险评估和治疗建议,目前已有主要依赖检验指标建立关于2型糖尿病[9]、原发性肝癌[10]、急性心梗[11]等疾病风险模型的多项研究报道。
3.有监督学习在可解释性检验报告的应用:本期刊登《人工智能在检验医学领域的应用和发展》[12]一文指出了在可解释性检验报告的核心:即赋予传统检验报告单除了数据和箭头或+/-以外更多的信息,如检验项目临床意义标注、异常结果综合分析解释、疾病和/或潜在风险提示、多种疾病危险度排序加注释。同时介绍了以胡长爱等[13]研究作为该方向的代表,该团队通过AdaBoost法同时对7种泌尿系统疾病进行预测建模,可以区分尿液报告的异常程度,最后通过模型可以预测可能的疾病相似度,同时匹配出个性化的诊疗建议。这很好地体现了检验报告从单纯数据模式向辅助临床诊断方向发展这一趋势。可见,在ML在可解释性检验报告的临床应用中,更为重要的是它带来了一种全新的检验报告解读方式。
(二)无监督学习在检验医学的应用
无监督学习,即从无标签的训练数据中推断结论。这种方式可以探索性数据分析阶段用于发现隐藏的模式或者对数据进行分组,也可简单理解为:给定数据,寻找隐藏的结构。典型算法包括:k均值聚类、分层聚类算法,最大期望算法,主成分分析等。
1.无监督学习在质谱数据分析的应用:基质辅助激光解吸电离飞行时间质谱目前通常在大多数临床实验室中用作微生物菌种的分类鉴定及耐药性检测。质谱数据本身具有高维性特征,但目前临床结果分析仅依赖少量的特征,如质荷比和峰高等,大量的质谱信息实质上并没有利用到,因此对于发育密切相关的物种,分辨率会下降到属水平。有学者[14]通过k均值聚类和分层聚类算法,从基质辅助激光解吸电离飞行时间质谱数据中对未知布鲁菌属(无标签)进行训练,实现了对44个布鲁菌属精确分类,从而实现高度准确的细菌物种识别以实现最佳物种识别。随着质谱技术的发展普及,临床应用面也越来越广,使用无监督学习的方法对质谱数据进行处理及可视化,表现了较好的效果,值得借鉴和参考。
2. 无监督学习在检验结果自动审核中的应用:检验报告自动审核是现代医学实验室自动化发展的重要方向。本期刊登的《机器学习在检验医学中的应用进展与挑战》[15]一文,指出自动审核的本质在于通过将专家在报告审核中的应用的临床关联分析思路、判断依据等信息转化成统一的逻辑语言这一核心要素。同时,作者分别列举了国内外两项[16, 17]非常有代表性的研究进行介绍,这两项研究均利用无监督学习(人工神经网络和自编码机算法),尝试完全排除任何人为干预、无须标注数据,仅靠原始临床检验结果建立自动审核判断机制。为日后检验报告自动审核系统提供了一种新的思路和方法借鉴。
(三)强化学习(reinforcement learning,RL)在检验医学的应用
RL是ML的一个领域。它关注的是如何在一个环境中采取行动以便最大化某种累积的回报。可理解为:给定数据,学习如何最优解,以求最大化长期收益。算法包括:Q-learning算法、有限状态机等。
1.RL在检验项目整合优化中的应用:随着检测技术日新月异,各种生物学标志物层出不穷,实质上指标间可能存在功能交叉重叠的情况,重复检测不仅不能使患者获益还造成不必要的医疗浪费,对检测项目进行评价与合理应用,是检验医学研究的最重要任务之一[18]。
RL是假设系统与环境的互动是基于马尔科夫决策过程,在互动中学习最优行为策略,往往将其应用于求最优解的研究中。如Cheng等[19]研究了在急诊重症监护病房患者如何进行实验室检测项目开单的最佳方案,其利用了一种叫做多输出高斯进程的强化学习方法,在保证不影响重症监护病房患者临床决策的前提下,计算了检验项目对两种致死率较高的病种——脓毒血症及急性肾衰竭患者的相关获益及风险之间存在固有的权衡,并对特定时间给予特定的检测提出建议。如此可以在保证治疗效果的情况下降低实验室检测的频率,最终达到减少患者医疗开支的目的。
2. RL在实验室流程优化管理的应用:利用RL可以整合调配实验室资源配置,提高整个实验室内部的流程效率,优化以最大限度地调度检验分析能力[3]。在标本采集阶段可以实现全自动备管、叫号、采血,引导患者分流,缩短排队时间,提高患者满意率;标本运输阶段可以让标本在流转作业过程中形成便捷有效的分拨模式,实现物流信息的可视化,甄别其中的冗余环节,提升标本流转效率[6];利用患者数据的移动均值方法来对实验室误差进行质量控制可以提高实验室检验结果的准确性和整体质量水平[20, 21]。
二、机器学习在检验医学应用存在的问题及对策
(一)有监督学习可重复及过拟合问题
诸多研究建立的ML模型往往在训练集上可以获得较为理想的结果,但应用于真实临床世界时,往往模型不能可重复或者出现准确性严重下降的情况。其主要原由就在于训练集是经过筛选的、标注完整的样本,而真实临床世界中则情况复杂得多,存在着数据缺失或者出现大量训练集中没有出现的例外情况。解决的办法就是提高训练集数量,增加模型的泛化能力,但同时也会伴随新的挑战,即海量数据的标注需要大量的时间成本及人力成本。
(二)数据的质量问题
在医院内部信息系统中,检验实验室管理系统无法与门诊系统、住院电子病历系统进行有效地关联,数据结构相对孤立,因此在获取临床信息的时候可能存在不规范、统计口径随意化和、信息缺失的情况。另外,疾病是以不确定的方式随着时间的推移而进展和变化的,同一患者处于不同疾病阶段的实验室检测结果可能截然不同。然而,现有的ML模型,都假设基于静态矢量的输入,无法以自然的方式处理时间因素。因此,设计建设可有效关联各医学信息系统,并能够处理序惯性医疗数据是解决的方法之一。
(三)模型的可解释性问题
尽管ML模型在相当多的应用领域都取得了成功,但它们通常被视为“黑匣子”,无法给出具体规则和逻辑,让研究者无法理解、解释和信任预测结果。一个预测表现接近完美、却属于“黑匣子”的ML模型,可能会误导医疗决策招致系统性风险,一方面,这在一定程度上影响了模型在临床的应用前景。另一方面,若不能理解模型运转原理,也就无从对模型进一步进行修改、优化。本期专题中刊出的《机器学习在检验医学中的应用进展与挑战》《人工智能在检验医学领域的应用和发展》等[20, 21]2篇文章均指出了这个问题,因此对ML模型进行解释、可视化,是实现临床转化的关键一步。近年来提出的SHAP(Shapley additive explanations)是解决模型可解释性的一种方法[22],该模型来源于经济学家Lloyd Shapley提出的博弈论概念,随后被开发为一个“模型解释”工具,用于解释任何ML模型的输出。SHAP最大的优势是能反映出每一份样本中某个特征的影响力,是正影响还是负影响,如此便间接实现了对模型内部参数及规则的可视化,或许这是解决模型可解释性的方法之一。
三、结语
随着医学实验室不断地自动化、数字化、信息化,检验“大数据”这一理念已深入人心。面对这一宝库,运用ML或者深度学习的方法进行探索目前在检验医学领域尚处于起步阶段,特别在当前更为热门的深度学习领域更是少之又少。从2021年美国食品药品监督管理局首次公布的已获得许可的人工智能相关医疗器械名单情况来看,90%以上的产品聚焦在放射影像、心血管、血液3类方向。而近期国家工信部与国家药监局共同组织的“人工智能医疗器械创新任务揭榜工作”公布的结果,检验医学领域的项目较少。智能辅助诊断产品强调需要拥有核心技术知识产权,检验医学专业无论是相关研究、专利还是成果转化都较其他专业有较大差距。
本期刊出的ML在检验医学的应用和研究进展的相关内容,特邀及筛选专家组稿,相对全面地阐述了ML在检验医学的应用进展及面对的若干挑战,并针对所面对的若干共性问题提出了比较有探索性的解决意见。希望以此可以加强在检验医学领域中ML的研究和应用,共同推进ML技术的临床转化,实现在医学实验室的实用化、产业化,早日实现辅助临床决策的目标。