摘要
医疗数据属于大数据的一种,具有数据量大、增长迅速、多模态、高价值、重隐私等特点。针对医疗数据特点,如何对其进行统一、高效的组织管理是目前重要的研究方向。为此,通过阐述医疗数据特点,分析其存储需求,梳理分布式系统和非关系型数据库在医疗数据存储领域的应用现状,综合分析了未来医疗数据待解决的关键核心问题,旨在探讨效率高、响应快的医疗数据存储方案。
关键词
医疗数据; 存储方案; 分布式系统; NoSQL数据库
0 引言
近年来,随着信息技术飞速发展,医疗与医学研究领域正步入大数据时代,医疗数据的日增长量达到了TB级别[1]。海量的医疗数据蕴含着巨大的价值,构建医疗数据存储平台,实现数据的统一存储与检索,有利于不同医疗机构之间共享数据[2]。并且,在平台上增设数据分析服务功能,有利于推动辅助诊疗和疾病预测技术的发展。
医疗数据属于大数据,具有数据来源复杂、结构多样、规模巨大、增长迅速、多模态性等特点[3]。其中,多模态性包括二维数据、图像、视频、文本文档等[4]。然而,在当前医疗服务业务中,获取数据的实时性、存储设备的可靠性及数据分析的准确性仍是亟待解决的三大问题。
传统关系型数据库无法存储非结构化数据且受到单