医疗保健数据仓库模型解释

2018年10月17日
史蒂夫·巴洛

客户运营高级副总裁兼联合创始人

布莱恩•辛顿

DOS平台业务高级副总裁兼总经理世界杯厄瓜多尔vs塞内加尔波胆预测

文章总结


想知道适合您的组织的最佳医疗保健数据仓库吗?您需要首先对数据建模,因为用于构建医疗保健企业数据仓库(EDW)的数据模型将对系统的价值实现时间和适应性产生重大影响。我在下面描述的每个模型都在设计过程的不同时间绑定数据,有些较早,有些较晚。
正如您将看到的,我们认为稍后绑定数据更好。这三种方法是1)企业数据模型,2)独立数据模型,3)Health Catalyst后期绑定™方法。世界杯葡萄牙vs加纳即时走地

下载

为您的医疗系统构建最佳的企业数据仓库(EDW)首先要对数据建模。为什么?因为用于构建EDW的数据模型对系统的时间到价值和适应性都有重大影响。本文概述了两种最常见的关系数据模型的优缺点,并将它们与Health Catalyst进行比较世界杯葡萄牙vs加纳即时走地®后期绑定™方法。

“绑定”数据是指将从源系统聚合的数据映射到EDW中的标准化词汇表(例如SNOMED和RxNorm)和业务规则(例如驻留时间定义和ADT规则)的过程。换句话说,这意味着优化来自所有这些不同来源的数据,以便它们可以一起用于分析。任何关系数据库模型都需要以这种方式绑定数据。

本文描述的每个模型在设计过程中的不同时间绑定数据:一些较早,一些较晚。世界杯葡萄牙vs加纳即时走地Health Catalyst认为,在正确的时间绑定数据的方法是正确的方法(有时早,有时晚,有时介于两者之间)。采用限制您在早期或晚期绑定的灵活性的方法会限制您通过分析工作获得成功的能力。

企业数据模型方法

到数据仓库设计的企业数据模型方法(图1)是一种自顶向下的方法,目前大多数分析供应商都提倡这种方法。这种方法的目标是从一开始就为完美的数据库建模——提前确定您希望能够分析的一切,以提高结果、安全性和患者满意度,然后相应地构建数据库。

从理论上讲,如果您要从头开始构建一个新系统,那么企业数据模型方法是最佳选择。然而,在医疗保健的现实中,当您实现EDW时,您并不是在构建一个全新的系统;您正在构建一个从已经部署的系统接收数据的辅助系统。从现有系统中提取数据,并使它们在一个新的网络系统中很好地发挥作用,就像试图把一个苹果变成香蕉一样。只要有耐心,适当的技巧,再加上一点魔法,这是可能的,但这也非常耗时和昂贵。

企业数据模型方法的图形
图1:企业数据模型方法

在我从事医疗保健分析领域的这些年里,我从未见过一个使用这种方法的项目在经过两年的努力之后才取得很大成果。这种延迟的价值转化时间是该模型的一个显著缺点。提前绑定数据和定义每个可能的业务规则需要大量的时间。这种方法还有两个缺点:

  • 这个模型很早就绑定了数据。一旦绑定了数据,进行更改将变得非常困难和耗时。在医疗保健领域,业务规则、用例和词汇表变化很快。当你花了两年时间把苹果变成香蕉的时候,你可能会发现你真正需要的是一个橙子。不幸的是,因为您的数据从一开始就绑定到规则和词汇表,所以您只能使用香蕉。
  • 此模型倾向于忽略组织可用数据的实际情况。在理想的情况下,你可能想要衡量每个病例或糖尿病护理的成本。但是,您目前是否捕获了可以为您提供这些答案的数据?更好、更现实的方法是基于已有的数据构建EDW,逐步向理想的方向发展。企业数据模型不支持这种增量方法。

许多基于这种企业数据模型方法的数据仓库计划都以失败告终。

独立数据集市方法

数据仓库设计的独立数据集市方法是一种自底向上的方法,在这种方法中,您从小处开始,根据需要构建单独的数据集市。如果你想要分析收益周期或肿瘤学,你可以为它们建立一个单独的数据集市,从应用于该领域的少数源系统中引入数据。

这种方法的好处是您可以更快地开始实现和度量—这与企业数据模型方法的2 - 5年生命周期有很大的不同。然而,这种模式有三个主要的缺点:

  • 有了所有这些独立的数据集市,您就没有一个原子级的数据仓库来构建未来的其他数据集市。通常,数据集市不包含最低粒度级别的数据。在数据集市中转换的数据通常被总结到一两个级别,这意味着数据集市可能向您提供某个指标低于基准的信息,但不包含使您能够深入研究并确定该指标低的原因的粒度数据。
  • 该模型重复且不必要地轰炸源系统。您必须从每个源系统构建冗余提要来满足这些数据集市。想象一下,为您部署的每一个数据集市在您的EHR中构建一个新的提要:心力衰竭、妊娠、哮喘、糖尿病、肿瘤学等——列表可能会越来越长。
  • 与前面的模型一样,这种方法在过程的早期就绑定了数据。当数据被带入每个独立的数据集市时,它被映射到预定义的数据模型中,抑制了分析解决方案的适应性。

视频下面强调了这个模型的问题。举个杂货店购物的例子,假设你在烤饼干。食谱上写着你需要四个鸡蛋,两杯起酥油等。你去商店买你需要的东西,从纸盒里拿出四个鸡蛋,打开装起酥油的容器,用量杯量一下,等等。现在这种方法很有效,但以后当你需要烤蛋糕时,你就得去杂货店买三杯面粉。你懂的。

图2:解释了独立数据集市方法

健康催化世界杯葡萄牙vs加纳即时走地剂晚绑定™方法

世界杯葡萄牙vs加纳即时走地Health Catalyst提倡对数据建模采用后期绑定方法,以克服前两个模型固有的挑战。自适应的、实用的后期绑定方法旨在处理快速变化的业务规则和词汇表,这些业务规则和词汇表是医疗保健的特征。以下是Health Catalyst的后期绑定™方法的高级描述:世界杯葡萄牙vs加纳即时走地

原始数据区

在原始数据区域中,数据以其原生格式移动,无需转换或绑定到任何业务规则。通常,在这一层中添加的唯一组织或结构是概述哪些数据来自源系统——health Catalyst将这些区域称为源市场。世界杯葡萄牙vs加纳即时走地尽管所有数据都是从原始数据区开始的,但对于技术水平较低的用户来说,这一领域太大了。典型的用户包括ETL开发人员、数据管理员、数据分析师和数据科学家,他们的特点是能够从大量数据中获得新知识和见解。这个用户基础往往很小,并且花费大量时间筛选数据,然后将其推到其他区域。

受信任数据区域

源数据被摄取到EDW中,然后用于在可信数据区域中构建共享数据集市。术语在这一点上是标准化的(例如,RxNorm、SNOMED等)。受信任数据区域保存的数据在整个组织中充当普遍真理。更广泛的一组人已经对这些数据应用了广泛的治理,这些数据具有整个组织可以支持的更全面的定义。可信数据可以包括构建块,例如在某一段时间内的急诊科就诊次数、一年到下一年的住院率,或者基于风险的合同中的成员数量。

精细化数据区

将意义应用于原始数据,以便将其集成为通用格式,供特定业务线使用。细化数据区中的数据被分组到主题区域集市(sam,通常称为数据集市)中。部门经理寻找月底的数字将查询SAM而不是EDW。sam成为特定领域的真相来源。它们从更大的数据池中提取子集,并增加对财务、临床、运营、供应链或其他管理领域有意义的价值。

精细化的数据被广泛的人群使用,但还没有得到组织中每个人的支持。换句话说,超出特定学科领域的人可能无法从精炼的数据中获得意义。当应用于其数据元素的定义扩展到更大的人群中时,SAM就会提升到可信数据区域。

探索(沙盒)区

任何人都可以决定将数据从原始数据区、可信数据区或精炼数据区移到探索区。在这里,来自所有这些区域的数据都可以被修改为私人使用。一旦对信息进行了审查,就会推广它在精细化数据区中更广泛地使用。

后期绑定方法类似于即时数据绑定。当您只能猜测数据的所有用例是什么时,您不是预先尝试完善数据模型,而是在过程中正确的时间绑定数据,以解决实际的临床或业务问题(或者当对给定的临床或业务概念有普遍的共识时)。

您不必预先就数据模型做出最后的决定,因为您无法预见2年、3年或5年后会发生什么。后期绑定方法为您提供了最大的灵活性,可以根据需要使用数据来处理各种各样的用例,并防止您浪费资源。

用数据操作系统超越EDW

为了取得成功,数据仓库的后期绑定方法需要正确的技术基础。试图使用传统ETL或数据处理工具实现后期绑定数据仓库的组织经常发现自己被大量的分析请求搞得不知所措。他们的方法可伸缩,但他们的工具和人员不可伸缩。

是健康催化剂的核心世界杯葡萄牙vs加纳即时走地®数据操作系统(DOS™)平台是一个元数据驱动的数据处理引擎世界杯厄瓜多尔vs塞内加尔波胆预测和工具集,允许组织扩展他们的分析工作。它支持以比其他解决方案低得多的总拥有成本构建晚绑定数据仓库。2022卡塔尔世界杯赛程表时间此外,DOS允许您获取数据仓库中包含的分析值,并以新的和有趣的方式使用它,以推动整个组织的临床和业务改进。


幻灯片

您愿意使用或分享这些概念吗?下载本演示文稿,突出重点。

请按此下载幻灯片

精益医疗:Brent James博士的6种改进方法

这个网站使用cookies

我们以为您提供相关、有用的内容而自豪。我们可以用cookies来追踪你所阅读的内容吗?我们非常重视您的隐私。详情请参阅我们的隐私政策了解详情和任何问题。