为什么说医疗没有大数据?

为什么说医疗没有大数据?

Tip:之前也有在医院和公卫体系里工作过 说一下我的感受 说的不对望指出 2024.03.23

1.大多数不是数仓业务,不符合数仓体系
这句话应该这样理解,医疗没有大数据数仓业务,kimball工具箱书里提到,数仓是用来衡量和监控业务系统的工作状态。比如,商品,库存,物流,财务。都有很明显的业务特质,就说商品的买卖,物流的快慢影响着公司的整体状况,收益。所以通一样的,医院的通用数仓体系应该是本公司的收益为主体。Killball中的建模体系也是如此。分析每个病人,器材的消耗,时间的消耗,器材使用的时间,这才是医院的业务。用来衡量医院的工作收益状态。

我觉得大数据数仓中什么是自己的业务,就是自己主要在干什么,商品就销售产品,医院就是病人的治疗,这才符合数仓的业务特质,分析自己业务的运行状态。

但是当前的很多医疗服务,比如慢性病监管。和公卫合作的,帮助监控慢病的控制,医院的执行的其实医院的数仓业务,是缺乏业务性的,他的关注点比较单一,就是这个医院的管理有没有达标,慢病患者数,慢病监管情况。
他关注慢病患者的控制管理,但是慢病患者的控制管理,缺乏业务特质。不是业务系统。

这些数据本身就缺少
(1)通用数仓的多关联和多记录,时间 位置 事件 因为每个维度都在影响我们的业务。其实指标是单一向的。数据分析的方向也是单一的
(2)明显的维度性,假如我们的要求是衡量病人的健康状态,其实医院记录的信息偏向于文本。很难全面的分析一个人的状态。这些数据又各种杂乱。偏向文本分析,不像数仓卖一个东西很明确,一个sql就可以分析的出来。

所以非业务性数仓,本身可分析的指标是有限的。因为价值的不同,医院只关注对应的指标。
不像业务系统,关联的所有的事件记录,都是对业务状态有影响的。

Tip:
而且 院端场景化建设是很固定化,都是跟着政策走,不是想出什么就出什么。

2.数据量和大数据的数据量有差异
除了对业务本身关注和价值的问题,医院的数据量也并不大。很难达到PB级,也是业务的问题。商品的售出频率肯定比病人多,而这些数据还和所在的区域,医院有关。如果是一个医院,本身数据量也很有限。往往是以区域来划分。就按照我之前的一个区域 三四家医院
500G * 4 = 2000G 差不多2T, 如果是金融公司 记录着收支支出这种,一台节点,分到3T是很常见。这样算来3T的5节点集群,可以包含15家医院。达到15家医院这个量级还是比较难的。
其通用业务和业务的单位(医院),不满足大数据的大数据量。对于动辄上百上千来的大数据集群还是小乌见大乌了。

3.医疗体系的限制
(1).医院系统独自发展
除了业务和数据量的限制,医院本身还受到了来自本身业务体系的限制,就是因为安全性,和his厂商的限制。每个医院的数据标准,数据库,数据权限的方式,都是不同的。
每个医院都在独立运作,就算同一家his厂商的版本不同,也是有较大差异的。而且医院很多,包括很多文本类口述的信息。不像数仓业务那么明确。

(2)医院数据的可操作性
医院的数据是可删可改的!!!!!包括很多记录的修改记录 只会保留一次。
就诊系统,并不是直接关联检查检验系统。也是为了医院系统的方便。很多数据都是偏记录的。存在大量冗余,字段都是冗余设计。用来记录病人的状态,这些并非业务信息,而是信息记录性的。身份证也未必非要验证才能就诊。
这些数据并非完全在业务记录本身。 不同系统之间也不相互关联。

所以本身并非业务系统,更倾向于医疗记录系统的原因。
大数据的很多比如t+1的离线系统就会很繁杂。这些数据是存在更改(记录修改),不规范(标准不一),不确定性(脏数据)的。而通常电商系统就很明确,卖了就是卖了。病人的疾病分析是吧,有可能这次看错了,干扰分析准确。本身大数据技术栈,只擅长分析明确的业务。而医疗中,大部分的数据还是关于病人特质的医疗记录。

综上:
为什么说医疗没有大数据的原因主要是
1.医院的大数据服务,比如慢病监管,通常不符合,大数据数仓的特质,缺乏自身业务性。 (4分)
2.数据量不够大,不适合直接上大数据集群。(4分)
3.数据操作麻烦,记录内容繁杂,系统直接无直接关联,缺乏数据规范,数据准确。(2分)

其实很多我觉得利用大数据的并非数仓体系,而数据建模,数据看板之类的往往是通用数仓。
数据量大的,比如文本记录系统,比如论文,地理记录系统,比如国家地图,他们都有很大的数据量,也会用hadoop,spark。但是都不能通用意义上作为大数据数仓。
大数据技术是大量数据处理能力的体现,数仓则是数据体系的体现。
而对医疗大数据来的发展来说,目前还在初步发展阶段,和现阶段通用大数据数仓应用的特质,还是有差异的。

以下粘贴chartGPT的回答做参考:

为什么说医疗没有大数据?
事实上,并不是说医疗领域完全没有大数据,而是应该说医疗领域在大数据的应用和挖掘方面存在一些挑战和限制。

下面列举几个原因解释为什么有人可能会说“医疗没有大数据”:

数据隐私和安全性:医疗信息属于个人隐私,要受到严格的法律和伦理规范保护(如HIPAA法规)。因此,收集和共享医疗数据受到了很多限制,这影响了大数据的生成和流动。

数据标准化和互操作性:医疗数据往往来自不同的医疗机构,包括医院、诊所、实验室等,它们使用不同的系统和标准来记录数据。这造成了数据整合的难题,限制了大型数据集的构建和分析。

数据质量和变异性:医疗数据包括结构化数据(如实验室结果)和非结构化数据(如医生的笔记)。非结构化数据的解释和利用需要复杂的处理过程,同时不同的医生和机构在记录数据时的差异性也会导致数据质量的不一致。

分析能力和舆论:医疗领域的大数据分析需要高级的技术和算法,以及专门知识的分析师来解读数据。不是所有的医疗机构都有资源来进行这些高级分析,而且对于用数据算法取代或辅助医生决策的接受度也各不相同。

政策和法规限制:随着数据隐私意识的提高,各国政府都在加强对于个人健康信息的保护法规,这些政策可能会限制大数据的收集和应用。

医疗领域的大数据潜力巨大,可以用于疾病预测、个体化治疗、流行病学研究和健康政策制定等多个方面。尽管存在上述挑战,许多卫生组织和研究机构仍在不断努力利用大数据改善医疗质量、降低成本和促进健康医疗创新。随着技术的发展和政策的调整,医疗界对大数据的利用预计会不断加强。

为什么说医疗有大数据?
说医疗有大数据是因为医疗领域实际上正在产生和处理大量的数据,且这个趋势还在不断增长。以下是几个原因说明为什么医疗领域拥有大数据:

电子健康记录(EHR):随着电子健康记录的广泛采用,医疗机构正在产生大量的结构化数据,包括病人的病史、治疗过程、药物处方、实验室检测结果等。

医疗设备:医疗仪器和监测设备,如心电图机、CT扫描仪、MRI机、可穿戴健康监测设备等,都在不断地收集和产生数据,这些都是医疗大数据的重要组成部分。

基因组和生物信息学数据:随着基因测序成本的降低,越来越多的基因组数据被用于疾病研究、药物发现和个体化医疗。基因和蛋白组数据非常庞大,它们对医疗大数据的增长贡献巨大。

研究和临床试验:医药研究和临床试验产生了大量的数据,这些数据可用于分析药物效果、副作用、患病率等重要信息。

互联网和社交媒体:患者和公众在互联网上分享的健康信息、论坛讨论和患者支持团体提供了非结构化的数据来源。

公共卫生和流行病学数据:政府和非政府组织收集的公共卫生数据(如疫情传播数据、免疫接种记录、健康调查数据)都构成医疗大数据的一部分。

医疗大数据的存在为实现更精准的诊断、治疗和预测疾病提供了可能性,并且有助于提高医疗系统的整体效率和质量。医疗大数据分析可以揭示治疗效果的模式、患者行为的趋势,甚至可以推动公共卫生政策的制定和改良。因此,医疗领域不仅拥有大数据,而且这些数据对于推动医学进步和提升患者护理标准至关重要。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值