医疗健康行业中个人信息去标识化的技术方案

开放隐私计算

编者按

在医疗健康行业,共享患者数据对改善和突破医疗技术至关重要,尤其是处在海量数据与人工智能技术的时代。但在利用和共享自然人的医疗健康数据同时,还应重点考量个人信息的安全风险。因此,如何在确保患者个人信息安全的同时实现数据共享和访问成为业界关注的焦点,医疗行业数据充分去识别化的技术方案因而进入了行业相关方的视野。

本文在HealthITAnalytics发布的Exploring Data De-Identification in Healthcare一文的基础上,阐释了医疗行业中数据去识别化技术及其与个人信息保护、人工智能和连接设备运用之间的关系,以探讨医疗健康行业中个人信息保护与数据共享的两全之策。

01

采取避免患者信息的“二次识别”的控制措施

最基本的“去识别化”是指无法根据病历中的信息重新识别自然人,通常涉及删除、隐藏个人姓名、出生日期、性别、地址或其他信息。除了这种基本的去识别化外,医疗行业利益相关者还需要了解其他信息以及可识别的级别,以保护患者信息。

实际上,存在一种超出潜在可识别性的信息级别,比如患者的IP地址、与患者起搏器相关联的唯一设备ID、仅患者就诊组织内可见的病历编号等信息。从理论上讲,这些信息很容易重新识别到该患者。因此,人们需要采用额外的手段,对这类级别的信息去识别化,并且该操作应当持续到自然人个体不再容易被识别为止。换句话说,除了提取个人身份信息之外,还要有额外的信息保护和控制措施

一个通过关联信息进行识别的例子:
一位亿万富翁在去年接受了针对特定类型癌症的特定治疗,通过与所选择的治疗方案、癌症类型和时间范围等信息的关联,以及在医疗环境之外(例如在社交媒体平台上)获得的健康信息,此患者信息变得可识别。

因此,可以从两个方面去考虑去识别化:一是提取特定信息,避免可以与特定个体相关联的信息,或者串联起来可以识别特定个体;二是如何使用一组数据集的因素组合来追踪特定个体。这不仅仅通过提取特定信息来实现,还通过限制数据集查询到特定个体的方式,防范追踪到特定个体。

02

通过隐私增强技术推进大规模医疗协作

在医疗行业,数据提取在个人信息保护合规方面发挥着重要

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值