大数据系统下的数据安全注意事项

在大数据时代,越大的公司,面临的数据安全风险越高,简要而言,主要分为六个部分:

        1. 后台被黑客攻击,例如SDK泄漏关键服务IP地址;
        2. 数据被爬取风险,例如简历信息被外界抓取;
        3. 内部使用风险,例如采集的用户数据是否存在泄漏风险;
        4. 生态公司风险,例如收购的公司数据安全规范能够达成一致;
        5. 开放数据风险,例如敏感数据泄漏等;
        6. 监督合规风险,例如政府监管部门的要求等。

以Hadoop为代表的大数据集群存在如下安全问题:

        1. 数据存储在同一集群中,非常集中;
        2. 分布式系统天然的复杂性,使得防护变得非常困难;
        3. 数据由于BI分析等需求,存在极强的流动性,防护边界非常宽泛。

在大公司的角度上,数据安全主要需要注意如下三方面:

        1. 数据要合法、合理、合规,避免用户的敏感数据被滥用;
        2. 建立完善的数据脱敏机制,评估内部、生态、对外开放三方面的数据风险;
        3. 建设完善的防火墙与应用安全机制,应对外部风险,如黑客攻击、爬取数据等。

当前的前沿数据安全技术:

        1. 同态加密:对密文进行计算,适合于那些将数据存储在云平台的公司,但性能消耗十分严重;
        2. 多方安全计算:多方分享数据进行计算,但性能消耗十分严重,且适用场景有限;
        3. SGX:通过硬件来保证数据的安全问题,适合线下金融等公司场景;
        4. 差分隐私:通过不关联个体的计算方式,得到整体层面的数据。

大数据集群中的数据安全措施:

        1. 敏感数据定义:通过打标签的形式,规定哪些数据是敏感信息;
        2. 建立权限控制机制:对于访问数据的用户权限进行严格的定义;
        3. 敏感数据的展示需要脱敏,包括:前缀保留、截断、隐藏、枚举、哈希、移位、置换、差分隐私、K-匿名、L-多样性等;
        4. 异常数据访问信息监控,包括:点异常、聚集异常、情景异常等;
        5. 数据提取流程:数据采集层打标签、数据分析层搭建隔离测试环境、数据应用层添加异常行为检测、产品对接进行数据安全审计等。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值