数据仓库中敏感信息数据的收集存储与分发

业务数据中经常会有一些客户信息,标的信息等敏感信息,这部分的信息由于保密原则,不能明文存储和传输,所以会使用到一些加密的流程,这里记录了一下目前我所了解的流程,欢迎分享更多场景与见解。

Step1——收集:来自不同渠道的业务数据一般会在传输时进行不同的加密,这些数据应当在业务承接系统先行按照不同的逻辑进行解密,保障不同渠道数据在录入时均是可以解析使用的。

Step2——存储:敏感数据在存入数据库的时候,应当使用一个内部的密钥进行加密,使进入数据库中的数据是由统一的密钥进行加密的。这种加密的数据可以在内部的多个系统之间流通,同时也可以被数仓同步。此处加密可以使用对称加密算法,内部系统与数仓均持有密钥可以解锁,此文中我们简称该密钥为内部密钥,内部密钥的持有应当进行权限控制,保障只有可信的人和系统才能对数据进行解密处理。

如果上游业务系统没有相关加密功能,数仓可以再这部分数据同步时主动进行加密,以保障数据在数仓中以密文形式存储。

Step3——分发:数仓在收集到各个系统的数据后,往往会存在给下游系统(报表展示,报送数据,风控系统)供数的需求,其中部分下游系统并不属于公司内部,因此在提供敏感数据时,数仓应当做到对于不同的数据使用不同的加密密钥。在实际实施过程中,可以由一个数据表记录分发给不同系统的不同外部密钥,然后在数据分发前,先对数仓内数据用内部密钥进行解密,然后通过指定外部密钥进行加密,得到和数仓中存储完全不同的密文后进行传输。

对于此处加密的处理,可以采用对称或者非对称两种方式,如果使用对称密钥,则记录不同系统外部密钥的数据表也需要利用内部密钥进行加密,非对称密钥则可以减少这部分麻烦。使用非对称加密时,外部密钥应当由外部系统自己生成,并将加密公钥提供给数仓存储到数据表中。

 

总结,数据仓库安全的收集存储和分发敏感数据是一个需要相当多环节结合的工作,其中还涉及多次加解密的工作,在实际生产中,大数据量会造成加解密环节大量运算资源消耗,安全和成本之间的平衡需要更多探讨。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值