数据脱敏分类及常用方案

1、数据脱敏概念

数据脱敏也叫数据的去隐私化,在我们给定脱敏规则和策略的情况下,对敏感数据比如 手机号、银行卡号 等信息,进行转换、修改或者遮盖的一种技术手段。该技术主要用于防止敏感数据直接在不可靠的环境下使用。
脱敏原则:数据脱敏应保持原有的数据特征、业务规则和数据关联性,保证后续开发、测试以及数据分析过程中不会受到脱敏的影响。确保脱敏前后的数据一致性和有效性。

2、数据脱敏分类

数据脱敏分为静态数据脱敏(SDM)和动态数据脱敏(DDM);
静态数据脱敏(SDM):静态数据脱敏需要建立新的非生产环境数据库用于和生产环境隔离,敏感数据由生产库抽取脱敏后存储到非生产库。这样脱敏后的数据与生产环境隔离,满足业务需要的同时又保障了生产数据的安全。
动态数据脱敏(DDM):一般用在生产环境,访问敏感数据时实时进行脱敏,因为有时在不同情况下对于同一敏感数据的读取,需要做不同级别的脱敏处理,例如:不同角色、不同权限所执行的脱敏方案会不同。

3、数据脱敏方案

常用的数据脱敏方案有:无效化、随机值、数据替换、对称加密、平均值、偏移和取整等;
无效化:无效化是指对敏感数据进行加密、截断或隐藏。这种方案一般会用特殊符号(如*)替换真实数据,操作简单,但是用户无法得知原数据的格式、可能会影响后续的数据应用。
随机值:随机值是指对敏感数据进行随机替换(数字替换数字、字母替换字母、文字替换文字)。这种脱敏方式会在一定程度上保证敏感数据的格式,便于后续的数据应用。一些有实际意义的文字脱敏的时候可能需要脱敏字典的支持,如人名,地名等。
数据替换:数据替换和无效化、随机值的脱敏方式比较相似,不过这里不是用特殊字符也不是用随机值,而是用特定的值来替换脱敏数据。
对称加密:对称加密是一种特殊的可逆脱敏方法,通过加密密钥和算法对敏感数据进行加密,密文格式与原始数据在逻辑规则上一致,通过密钥解密可以恢复原始数据,要注意的就是密钥的安全性。
平均值:平均值方案经常用在统计场景,针对数值型数据,我们先计算它们的均值,然后使脱敏后的值在均值附近随机分布,从而保持数据的总和不变。
偏移和取整:这种方式通过随机移位改变数字数据,偏移取整在保持了数据的安全性的同时保证了范围的大致真实性,比之前几种方案更接近真实数据,在大数据分析场景中意义比较大。

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值