目录
2014年写的一篇文章,希望能从多个角度帮助大家了解医疗卫生开放数据以及相关应用。
1 开放数据是什么?
首先来解释一下开放数据的意义。一个简单的回答是:互用性。互用性指的是不同系统和组织间协同工作 (协同操作) 的能力。在这里,它指的是协同操作或者混合不同数据集的能力。
我们采用「开放知识定义」来定义开放数据:
开放数据是一类可以被任何人免费使用、再利用、再分发的数据——在其限制上,顶多是要求署名和使用类似的协议再分发。
完整的「开放知识定义」对于这一定义给出了更为翔实的解释。这里总结出最关键的部分:
- 可获取性和可访问性:作品应当能够被完整获取,并且所需的花费应当不超过合理的重制费用(较好的获取方案是提供从网络下载数据)。数据也必须使用方便修改的格式。
- 再利用和再分发:数据应当使用允许再利用和再分发(包括与其他数据集整合后再分发的情况)的许可协议。
- 普遍参与性:每一个人都应当能够使用、再利用、再分发那些数据。因此就不允许有限制个人或团体使用的协议。比如,「非商业用途」限制就会限制「商业」用途因此不被允许。又比如限制只能在规定领域使用数据(比如只能在教育领域使用)也是不被允许的。
关于大数据、政务公开和开放数据之间的关系,请看下图的解释,此图来自于技术作家Joel Gurin的专著《Open Data Now》。
图片来源:笔者绘制。
2 开放数据的好处是什么?
政府鼓励社会对完全开放数据的再利用,企业可以基于免费、开放的数据构建可行的商业模式。越来越多的企业开始使用开放数据,未来五到十年,使用开放数据的企业将随处可见。
以新加坡政府为例,新加坡政府开放数据门户https://data.gov.sg专门提供了数据再利用应用程序,开发者可以利用开放接口https://data.gov.sg/developer 做开发。可以在https://data.gov.sg/group/health上找到新加坡的健康数据。
新加坡政府也通过OneMap https://www.onemap.sg平台向开发人员提供数据集虚拟化功能。此外,新加坡公共机构Up Singapore还举办了开放数据创新竞赛,特别是医疗卫生方面的Health Up Hackathon竞赛http://www.upsingapore.com/events/health-hackathon/,鼓励对医疗卫生开放数据再利用。
在美国,OpenData 500网站项目由NYU Governance Lab(GovLab)管理,前面提到的Joel Gurin在主持这个项目。OpenData 500的目的是为评估开放政府数据的经济价值提供基础,也鼓励创建新的开放数据驱动企业,同时推动政府和企业之间展开更有效使用开放数据的对话,首批企业列表已经公布在网站上。目前澳大利亚、墨西哥、美国、韩国、意大利和加拿大加入了这个网络。
这个项目在GitHub上的路径是https://github.com/GovLab/OpenData500
3 医疗卫生领域开放数据的目的是什么?
提高医疗卫生系统透明度
通过展示覆盖面广、深度合适和总量大的医疗卫生公共数据,有助于提高医疗卫生系统的透明度。
通过开放卫生机构和卫生从业人员的医疗质量方面的数据,可以帮助公众选择合适的卫生机构、专业人员以及相关治疗信息。
企业和个人基于开放的医疗卫生数据,可以构建新型商业模式为患者和医疗卫生机构、专业人员提供更好的服务.
以Archimedes为例,其现在属于Evidera,该公司利用医疗数据、临床研究数据创建了决策支持工具。反过来,它又构建了API,帮助开发者将糖尿病管理的最佳实践指南整合入用户关注的卫生、健康、临床支持、生活方式应用中。可以访问此网站获得具体信息http://www.sphanalytics.com/。
4 医疗卫生领域开放数据的类型是什么?
以下为各个国家的应用情况,数据来源于法国卫生部开放数据委员会报告。
数据类型 | 数据类型 | 数据内容 | 作用及延伸应用 | 典型应用的国家 | 网址 |
医疗卫生消费 | 所有医院每个病人每次就诊的相关数据 | 查询者只需在系统中输入相关搜索条件(譬如年龄、性别、年份等)即可下载生成表格。 | 丹麦 | Http://www.ncbi.nlm.nih.gov
| |
疾病类 | 流行病数据集 | 病例数量和热点区域 | 便于事先安排好预防工作,有助于减少登革热病传染风险 | 新加坡 | |
卫生机构和卫生从业人员的医疗质量 | 所有医院八类科室的等候时间 | 等候时间工具,估计不同地区不同类型科室的等候时间 | 加拿大 | http://www.ourhealthsystem.ca
| |
医疗卫生系统的五大关键数据 | 每个医院就诊难度、医疗水平、费用、疾病预防、全国人口健康状况的变化 | 加拿大 | http://www.ourhealthsystem.ca | ||
平均住院长度和不同医院价目表 | 根据地区、患者年龄和医疗类型区分 | 病人开销评价器,帮助患者预测平均住院时间和成本 | 加拿大 | http://www.ourhealthsystem.ca
| |
取得医学学位的医疗卫生从业人员的全部数据 | 如姓名、出生日期、工作地点、职业、获得学位时间等信息 | 丹麦 | http://www.Sundhed.dk
| ||
住院后死亡率 | 提供搜索工具帮助公众选择合适的卫生机构和专业人员 | 英国 | http://www.nhs.uk 不仅能帮助患者查找医疗信息还可在网上就诊:只需输入关键词或所患症状,该网站即能查找出500种药物或者700种疾病的信息,还能帮助患者查找合适的医生及相关治疗信息 | ||
全国各医疗机构患者满意度得分 | 开放了医院处方、月平均用药量、医疗成本等方面的数据 | 帮助英国公民选择医疗机构并在线预约看病 | 英国 | http://www.nhs.uk | |
卫生机构医疗质量数据 | 包含了患者满意度调查报告和医院医疗质量指标方面的数据 | 提供搜索工具帮助公众选择合适的卫生机构和专业人员 | 美国 | http://www.medicare.gov/hospitalcompare/compare.html 医院比较(Hospital Compare)数据集 | |
药品类 | 医药产品统计登记册 | 包括了所有医药产品的销售记录,并根据年份、出厂地区、购买者年龄和性别等加以分类 | 丹麦 | http://www.ssi.dk/English/HealthdataandICT/Health%20data/Registries/Register%20of%20Medicinal%20Products%20Statistics.aspx | |
WONDER数据库 | 包含了不同年龄和性别的患者对不同类型疫苗引起的不良反应的数量 | 美国 | http://wonder.cdc.gov |
5 医疗卫生领域开放数据的有利因素是什么?
许多国家通过制定公共数据开放战略来推动公共数据开放,鼓励经济创新和政府信息透明化。
部分国家具备了与信息权利相关的所有法律。此外,部分国家还通过法律、法规或政府文件要求公共部门开放数据。例如,加拿大政府2010年的《获取信息法》要求地区公共机构公布数据清单并按相关格式要求开放数据;美国的《医治保险携带和责任法案》有利地促进了“医疗保险和医疗补助”数据库的建立。
医疗卫生数据的收集、处理和汇总工作对数据开放的范围、深度等都有影响。许多国家负责汇集医疗卫生数据的公共机构有力地促进了广域数据库的建立,具有重要的作用。
当然开放数据也存在一些不利因素,如隐私可能被无意侵犯,数据透明带来消极后果以及数据可能被误读和误用,需要政府和企业一起做相应决策和引导。
6 全球医疗卫生领域开放数据的时间线
不同国家因卫生系统组织结构、司法环境、历史和政治环境的不同,开放数据的策略也各具特色。下图为最具参考性和代表性的5个国家(英国、美国、加拿大、丹麦和新加坡)公共数据开放战略的时间线。
图片来源:笔者绘制。
7 中国医疗卫生领域开放数据的现状
全国的开放数据可以从每年的卫生统计年鉴中获取,最近的数据可从《中国卫生和计划生育统计年鉴2015》一书获取,也可以从国家数据http://data.stats.gov.cn/和卫生计生统计 http://www.moh.gov.cn/zwgkzt/pwstj/list.shtml中获取信息。
以下的城市目前建立了开放数据平台,提供了卫生机构的一些信息,但数量较少,有待进一步发展。
数说南海 http://data.nanhai.gov.cn/
上海市政府数据服务网 http://data.stats.gov.cn/
北京市政务数据资源网 http://www.bjdata.gov.cn/
无锡市政府数据服务网 http://opendata.wuxi.gov.cn/
另外,开放数据中国网站 http://opendatachina.com/ (现已无效)是一个专注于开放数据的虚拟的合作性网络。这个网络提供平台供个人、非营利机构、商业公司、政府机构共同协作创建中国的开放数据生态。微信公众号为开放数据中国。
8 参考资料
Open Data Handbook http://opendatahandbook.org/zh_CN/what-is-open-data/index.html
美国健康开放数据 https://data.healthcare.gov/
The GovernanceLab@NYU http://thegovlab.org/
NewOpen Data on Healthcare.gov Obamacare Health Insurance Plans
http://socialhealthinsights.com/2013/10/healthcare-gov-open-data/
英国健康开放数据 http://openhealthcare.org.uk/
Health &Socail Care InformationCentre in UK http://www.hscic.gov.uk/transparency
全球医疗卫生领域公共数据开放比较-T媒体
彭彬彬:开放医疗数据将构成新型的医患互动-搜狐健康
开放数据:2014年最热门的竞争领域 http://www.csdn.net/article/2014-01-13/2818114-open-data
French Open Data in Health Commissionsubmits new report
http://www.epsiplatform.eu/content/french-open-data-health-commission-submits-new-report
欢迎大家留言,一起研究开放数据的使用和影响。
注:以上链接于2016年搜集,如果链接失效,请谅。