第三方数据取不了现 真相|数据爆炸时代为什么“数据匮乏”?
我们正处在“数据爆炸”时代!据IDC发布的《数字宇宙驱动医疗行业数据增长》报告显示,医疗行业数据量每年以48%的速度增长,很多大型医院的数据积累已达PB级。PB是什么概念?人类功能记忆的容量预计在1.25个TB,这意味着,800个人类记忆才相当于1个PB。
既然医院数据量这么“大”,为何行业专家都在谈“中国没有真正的医疗大数据”,临床都在抱怨 “没有数据可用”?
01 数据量大≠大数据
从构成上来看,数据主要可分为结构化数据、文本数据及影像数据,三者数据体量之比大约为1:10:1000。一般来说,文本数据及影像数据等非结构化数据,只满足“人读”需求,在保存内容的同时保存外观,相当于纸质病历的作用,计算机难以执行。结构化数据满足“机读”需求,保存为数据库、XML等结构。
从数据交换来看,医院上线的异构信息系统有几十到上百个不等,缺乏统一的标准与接口支持,各系统数据共享还是个难题。且随着技术变迁与系统迭代,不同厂商的系统数据结构不相同,不同厂商、不同时期的数据编码也不尽相同,医院存储的历史数据面临解读问题。
数据的结构化存取以及集中化管理,成为数据利用的重要环节,也是过去很多大数据平台主要攻克的问题。但很多大数据平台只解决了有限数据汇集,比如,数据中心只采集到电子病历系统的数据,或是集成平台的数据,大量体检数据、互联网问诊**、外院历史病历数据无法获取。数据不全、量级也不够大,并没有建立起真正以患者为中心的全生命周期数据。
要想数据服务于业务并带来价值变现,数据全要素整合是前提。基于强大的采集技术和业务逻辑设计,把院内、院外全息数据进行整合,是构建医疗大数据的第一步。在此基础上,加强数据的标准化处理,满足不用部门、不同机构之间数据调用的需要,才能真正让数据“活起来”。
高灵智腾数据平台整合院端业务系统、体检、互联网诊疗、院外历次就诊等不同业务维度数据,以及诊前、诊中、诊后不同时间维度数据
通过主索引+主数据管理,将原本零散、不关联的数据,变成有逻辑、可调用的决策信息,满足互联互通、集团化发展需求
02 数据在,不等于用户能便捷获取
做好了数据采集与整合,是不是数据中心的使命就完成了?用户就能得到想要的数据了?并非如此,还得看数据怎么组织,以什么样的方式展现给用户!
IDC报告显示,57%的医疗数据是可用的,但目前实现应用的数据只占所有医疗数据3.1%。不少大数据公司都在努力做数据整合、处理和组织展现,但有很大部分数据,只是在数据池里,用户需要的时候却无法找到或是获取的成本很高。
例如,医生想要某一段时间内患者临床指标的变化情况,以判断下一步是否需要调整治疗方案。却发现,要么TA只能去多个系统翻看报告单,要么TA去数据中心翻查时,遭遇记不清某项检测的具体执行日期,找不到相应的数据,不管哪一种方式,成本都很高,关键还可能浪费了时间却一无所获。
我们必须统一一个思想,数据只有在服务于用户切实需求时,才产生价值。如何更好地满足用户场景化需要,这是当前大数据应用需要回答的首要问题。不能说,医院建立了数据中心,但是临床医生需要某些数据时,还得翻看电子病历系统的**,然后手动在Excel中录入,或是让信息科用SQL捞数据。维持这种低效的数据方式,就失去了数据中心建设的意义。
因此,数据的组织必须围绕用户的场景化需求,并直观展现。例如,某血液科医生想看看自己管理的患者情况,分析一下进行CAR-T治疗后的指标变化。这时,给TA配置CAR-T主题数据,在首页概览优先展示其最关注的检测、药物、手术等指标,并且进行图表展示和异常值预警,一定比“人体躯干图”的数据组织,更能提升TA的业务效率。
高灵智腾构建了以患者为中心的统一临床视图,数据视图按就诊方式、诊疗进程、操作先后顺序等,进行多维度、结构化、曲线图展现
同时,可以让不同的用户自定义自己重点关注的数据,也可以把数据中心以开放API方式给到第三方,提高其系统应用的效果,为不同板块应用进行赋能,数据的价值发挥最大化。
全球知名咨询公司麦肯锡在一份报告中指出,排除体制障碍,大数据分析可以帮助美国的医疗服务业每年创造3000亿美元的附加价值。数据创造价值的时代已经来临,有人将数据比喻为新时代的“石油”和“金矿”,国家层面也将数据定义为与土地、劳动力、资本、技术并列的五大生产要素之一。加强数据的有效整合、组织,提高医疗数据的有效利用率,将是未来高质量医院破圈突破竞争的核心推动力之一。
-科技重塑医疗 赋能业务生态-