大数据技术在数据安全治理中的应用

大数据技术在数据安全治理中的应用

程伟1,2, 马成2, 凌捷3

1 清华大学计算机科学与技术系,北京 100084

2  联通(广东)产业互联网有限公司,广东 广州 510320

3  广东工业大学计算机学院,广东 广州 510006

摘要面对新形势下的数据安全治理挑战,顺应数据安全领域的技术发展趋势,针对大型国企在数据安全治理实际应用中突出的关键权限人员识别问题,提出了一种基于图算法的关键权限人员识别技术。该技术可以发现系统中潜在的权限影响因素,并可从多个角度衡量不同含义的权重影响力,识别结果可解释性强。针对数据安全治理中的用户与实体行为异常检测问题,提出一种基于生成对抗网络的用户与实体行为异常检测方法,实验结果表明,所提方法的精确率、召回率和F1值的平均值均优于对比基线模型方法。设计开发了数据安全平台,平台在降低数据安全风险、辅助企业合规建设、促进数据开发利用等方面起到了重要作用,已在多个数据集中管理项目中得到应用,能满足安全场景下的大数据处理需求,具有较好的应用推广价值。

关键词 数据安全治理 ; 图算法 ; 用户与实体行为分析 ; 数据安全平台

e25547443f4b5cd6f3551b89ad2a18ec.jpeg

论文引用格式:

程伟, 马成, 凌捷. 大数据技术在数据安全治理中的应用[J]. 大数据, 2023, 9(6): 3-14.

CHENG W, MA C, LING J. Application of big data technology in data security governance[J]. Big Data Research, 2023, 9(6): 3-14.

c9c22e07672e286f8d65783f790887c3.jpeg

0 引言

数据安全事关国家安全、社会稳定、经济发展和人民福祉,守护数据安全是信息通信央企的第一责任。近年来国家陆续出台《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《关键信息基础设施安全保护条例》等多项数据安全相关监管法律法规。国家“十四五”规划也明确要求保障国家数据安全,要求做好数据资源全生命周期安全保护,建立数据分类分级管理、数据安全审查、数据安全风险评估、监测预警和应急处置等基本制度。

基于以上国家政策大环境和大型企业数据安全治理应用需求的背景,很多大型企业在积极研究设计数据安全平台,以解决在资产管理、安全防护、日志审计等应用场景下普遍遇到的数据安全治理难题。随着大数据的大规模流转、汇总存储和分析,以及各种大数据技术架构、支撑平台和大数据软件的大范围使用,企业研究数据安全治理相关技术、建设数据安全平台来统筹多维度、全流程的数据安全治理任务,优化各设备的防护策略,强化数据安全治理体系,更具紧迫性。

本文提出了基于图算法的关键权限人员识别技术,该技术可发现系统中潜在的权限影响因素,并可从多个角度衡量不同含义的权重影响力;提出一种基于生成对抗网络的异常检测方法,实验结果表明,所提方法的精确率、召回率和F1值的平均值均优于对比基线模型方法;设计开发了数据安全平台,其在降低数据安全风险、辅助企业合规建设、促进数据开发利用等方面起到了重要作用,相关技术已在广东联通的数据安全治理实际项目中得到应用,取得了良好的社会经济效果。

1 数据安全治理与大数据分析技术

1.1 安全运营大数据的特点

数据安全治理的实践路径一般为“规划-建设-运营-优化”。其中,运营阶段旨在通过不断适配业务环境和风险管理需求,持续优化安全策略措施,确保整个数据安全治理体系有效运转。数据安全平台作为运营阶段的重要工具,可统一管理企业资产信息、安全运营信息、防护日志信息等安全运营数据。根据数据的应用特点,数据安全平台一般使用图数据库、事务型数据库、搜索引擎数据库存储对应信息。

企业资产信息包括主机资产信息、应用系统信息、数据源信息、人员账号信息等。由于各类信息之间存在从属或关联关系,使用图形数据库存储,可在业务中快速依据实体间的关系遍历搜索目标。

安全运营信息包括数据生存周期各阶段部署的安全专用防护设备信息(如VPN系统、数据库审计、API监测)、设备安全策略的执行情况以及运营工单信息。此类信息存储在事务型数据库中,以支持业务中对信息的频繁更新。

防护日志信息主要是各专用安全设备策略运行的结果日志。各设备每日监测产生大量用户和实体动作日志,这些日志大多是非结构数据,存储在搜索引擎数据库中,以应对在平台进行的中长文本检索任务。

在安全事务中,实时性很重要。数据安全平台在防护日志的解析与分析中采用流处理大数据架构,如图1所示。

a0260dba7c93a5444d6299cda0d79c31.jpeg

图1   日志数据处理流程

安全专用设备将产生的日志推送至消息队列后,把编写好的解析程序和分析程序作为消费者的实时读取日志,并将分析的结果(识别的告警或统计的指标)发送至新的消息队列,再经过ETL任务处理后写入搜索引擎数据库,支撑上层应用。基于流数据的大数据架构满足安全日志处理高吞吐、低延迟的性能要求,可做到日志产生一条就分析一条,并可及时感知数据安全态势。

数据安全平台作为安全运营数据的交汇系统

  • 21
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值