机器学习工具从非结构化健康数据中解锁最关键的洞见

2019年12月6日

文章总结

病人的评论，如“我感到头晕”或“我的胃疼”，可以告诉临床医生很多关于个人健康的信息，还有其他的背景信息，包括邮政编码、就业状况、交通状况等。然而，这些关键信息被捕获为自由文本或非结构化数据，这使得传统分析无法利用它。

机器学习工具(如NLP和文本挖掘)通过解锁非结构化数据中有价值的见解，帮助卫生系统更好地了解患者及其情况:

1.NLP为人类用户分析大量的自然语言数据。
2.文本挖掘通过分析大量文本(如词频、单词长度等)获得价值。

跳转到:

未接触的非结构化数据是综合护理的关键

文本挖掘为患者护理提供上下文—医疗机器学习成功的关键资源

机器学习在现实世界中提供真正的价值

自动化报告提高了准确性，减轻了提供者的负担

预测模型考虑到健康的社会决定因素

机器学习工具使医疗保健服务更进一步

下一个:

医疗保健质量改进:一个基本的业务策略

世界杯葡萄牙vs加纳即时走地健康催化剂编辑

本报告基于Shaun Grannis在2018年医疗保健分析峰会上的演讲，该演讲由医学博士、医学硕士、FAAFP、FACMI、生物医学信息学Regenstrief中心主任Shaun Grannis所作;Assoc。印第安纳大学医学院家庭医学系教授，题为“利用NLP、大数据和数据科学改善人口健康和个人护理结果的现实例子”。

许多医疗保健领域的领导者都认为，在周到的帮助下，医疗保健系统的护理人员和利益相关者会更有效、更好地开展工作它．这一概念推动了医疗保健领域的数据分析和技术集成。

但是周到的IT是什么意思呢?尽管许多卫生系统利用某种形式的IT，但这并不意味着它是最适合的。当卫生系统使用正确的技术来获得准确的数据，以提供更好的患者护理和改善结果时，就会出现深思熟虑的IT。

深思熟虑的IT利用机器学习来彻底改变卫生系统使用数据来确定最佳患者护理方案的方式。两个例子包括:

自然语言处理(NLP):为人类用户分析大量自然语言数据的数字化能力。
文本挖掘:通过分析大量文本(如词频、单词长度等)来获取价值。

有了NLP和文本挖掘，医疗保健组织开始利用技术来访问大量的非结构化患者数据可在EMR中获得(例如，护理记录或患者报告的文本，如“我的胃疼”)。NLP和文本挖掘可以处理传统分析无法处理的数据，从而打开更丰富、更复杂的数据源。

未接触的非结构化数据是综合护理的关键

传统分析通常使用结构化数据，主要由索赔数据组成，只占所有可用数据的20%左右。结构化数据以特定的、一致的格式存在，包括基本信息，如患者人口统计数据、实验室、ICD-9代码和药物。虽然这些数据很容易获得，但由于实验室处理时间和有限的信息本质上是基本的，揭示了患者的表面细节，但没有社会经济信息等有价值的细节，因此经常被延迟。

为了访问和理解剩余80%的非结构化数据(包括免费文本数据、医生命令数据、护理记录和听写记录)，卫生系统必须依赖NLP。NLP允许组织访问复杂的、更丰富的数据集，这些数据集很难获得，因为它们需要复杂的技术从EHR中的大量日常语言中获取价值。

非结构化数据存在于电子病历和其他地方，包含更深入、更复杂的信息，如患者自己描述症状的词汇或其他提供者的记录。它可以提供相关信息(例如，生活条件、患者如何看待自己的疾病、关于患者家庭的信息等)，也被称为健康的社会决定因素(SDoH)。

文本挖掘为患者护理提供上下文—医疗机器学习成功的关键资源

临床医生尽最大努力在他们的笔记中记录患者的轶事和评论，但这些记录很少超出EHR。自由文本输入(例如，“我感觉不舒服”，“我的右侧感觉麻木”，等等)在医疗接触中是很常见的，可以为试图提供最佳护理的临床医生提供关键的上下文。

然而，对于已经有经验的医疗团队来说，手动收集和分类自由文本笔记是一项挑战和耗时的工作倦怠与数据收集和输入有关。机器学习可以以文本挖掘的形式减轻手工组织自由文本注释的负担。文本挖掘是一种复杂的算法，它可以根据组织所选择的搜索词，快速而准确地将自由文本评论分类为正确的类别(例如，高优先级、低优先级等)。临床医生可以在整个护理过程中参考这些有价值的见解，而不必坐下来手动筛选大量的自由文本数据。

机器学习在现实世界中提供真正的价值

尽管算法不能提供100%的准确率，但它们仍然比人类更准确。机器学习算法可以在工作人员缺乏带宽的领域帮助卫生系统。例如，2005年，印第安纳大学卫生学院(IU Health)实现了机器学习早期预警系统以确定急诊科(ED)的异常趋势。在印第安纳大学实施该系统后不久，它向印第安纳州卫生官员(他们可以访问所有州卫生系统的数据)发送了一个警报，因为它标记出了异常高的患者水平，来急诊室抱怨同样的症状——包括头晕、精神错乱、恶心。一名卫生官员对这一警报作出了回应，通知了医院。

根据卫生系统使用的现有数据，除了预警系统之外，没有任何东西引起注意。但是，在对投诉进行进一步调查后，IU Health发现，所有抱怨这些症状的人都有一个共同点——他们都住在同一个公寓大楼里。后来，该公寓的加热器出现故障，向公寓内释放一氧化碳，导致房客生病。

有了机器学习快速分析、组织和分析大量数据的能力，卫生系统可以专注于对数据中的警报和异常值做出响应(图1)，在预防阶段进行干预，并立即采取行动解决护理方面的差距——而不是在患者病情恶化后提供护理。

医疗保健机器学习。急诊科访问数据中的异常值示例 — *图1。急诊科门诊的异常值。*

自动化报告提高了准确性，减轻了提供者的负担

机器学习还可以帮助组织减轻报告的负担，提高准确性。由于要报告的措施不计其数，报告数字也不断变化，卫生系统和临床医生难以始终如一地报告准确的信息，原因有很多:

他们的其他任务负担过重。
由于频繁的报告变更，他们不知道自己应该报告什么。
他们认为是别人干的。

机器学习可以使通信系统自动化，减少人工报告的负担，在某些情况下，甚至完全消除这种负担。在一次经历中，印第安纳大学医疗中心治疗了肯塔基地区的许多癌症患者。肯塔基州要求向州卫生部门报告癌症诊断，而研究期间的癌症发病率似乎太低了。

为了解决肯塔基州卫生部和IU Health之间癌症诊断报告不充分的沟通问题，IU Health使用机器学习——而不是传统的ICD-9代码——从免费文本报告中识别癌症发病率。机器学习算法标记了IU Health选择的单词(例如，“肿瘤”、“恶性的”等)。该算法被证明比人工标记系统更准确。

预测模型考虑到健康的社会决定因素

预测模型，如NLP和文本挖掘，也帮助提供者采取整体的方法来护理。例如，一个病人可能在当地的诊所接受高血压治疗，但可能有其他未满足的需求(例如，食物、住房和就业)。通常，这些SDoH对患者健康的影响与医疗服务一样大，甚至更大。由于患者平均在诊所度过的时间不到一生的1%，临床医生必须了解患者在诊所门外的生活。

为了有效地捕捉SDoH, IU Health使用环境数据、犯罪统计数据、住房统计数据和邮政编码的社会经济状况，结合临床数据，建立了一个定制的预测模型。该预测模型为初级保健诊所的社区护理护士提供了关于患者在医疗保健环境之外的挑战的信息;然后，护士可以确定转介的营养和财务咨询，以及更多。通过针对医疗保健组织独特人群的机器学习算法，提供者能够更全面地治疗患者。

机器学习工具使医疗保健服务更进一步

由于卫生数据只会增长，卫生系统需要工具来利用这一不断扩大的资源，以提取更好的数据。尽管机器学习并不完美，存在不可避免的误差范围，而且该行业的问题仍多于答案，但机器学习开始在复杂的医疗保健领域提供真正的价值。

随着卫生系统在预算和报销不断减少的情况下继续提供高质量的医疗服务，数据和分析对成功至关重要。然而，该行业需要更多高质量的数据来开发更好的算法来回答正确的问题。这些见解将使临床医生在依靠数据做出最明智的决定的同时，专注于患者。机器学习永远不会取代医疗保健中的人为因素，但它可以减轻护理团队的耗时任务，使他们能够专注于最重要的事情——向患者提供护理，以何种方式、何时以及在何处需要护理。

幻灯片

您愿意使用或分享这些概念吗?下载突出重点的演示文稿。

请按此下载幻灯片

机器学习工具从非结构化健康数据中解锁最关键的洞见从世界杯葡萄牙vs加纳即时走地

德国vs家具

这个网站使用cookies

我们以为您提供相关、有用的内容而自豪。我们可以用cookies来追踪你所阅读的内容吗?我们非常重视您的隐私。详情请参阅我们的隐私政策了解详情和任何问题。

机器学习工具从非结构化健康数据中解锁最关键的洞见

世界杯葡萄牙vs加纳即时走地健康催化剂编辑

文章总结

跳转到:

下一个:

医疗保健质量改进:一个基本的业务策略

世界杯葡萄牙vs加纳即时走地健康催化剂编辑

未接触的非结构化数据是综合护理的关键

文本挖掘为患者护理提供上下文—医疗机器学习成功的关键资源

机器学习在现实世界中提供真正的价值

自动化报告提高了准确性，减轻了提供者的负担

预测模型考虑到健康的社会决定因素

机器学习工具使医疗保健服务更进一步

更多的阅读

幻灯片

这个网站使用cookies