非结构化数据增长带来隐藏的云安全和合规风险

有一个经常重复的统计数据,今天存在的所有数据中有 90% 是在过去两年中创建的。

这个数字的出处是模糊和有争议的,它可以追溯到近 10 年前,所以即使当时是真的,今天这个百分比可能更高。但无可争议的是,信息的指数级增长仍在继续。IDC 预测,到 2025 年,全球数据总量将从 2018 年的 33字节增加 175字节。

在整体数据增长中,越来越多的非结构化数据会带来安全和合规风险。据估计,组织拥有的高达 90% 的数据现在是非结构化的,并且以每年 55-65% 的速度增长。这包括文档、电子表格、照片、视频、音频、网页、文本文件、社交媒体和幻灯片演示等内容,其中可能包含难以跟踪和管理的敏感或个人身份信息 (PII)。

例如,人们可能会将所有应用程序的密码保存在未加密或无密码的 Excel 文件中,然后将其存储在 OneDrive 上的文件夹中,因为他们认为它是安全的。或者有人可能会为工作或签证申请拍摄包含大量 PII 的护照的照片或扫描件,并与 HR 共享,从而将其存储在 OneDrive 或 SharePoint 上。这些事情我们都做过,而且很容易做到,而无需真正考虑。

数据分类与合规风险

这种非结构化数据的问题在于它不存在于数据库中并且具有预定义的数据模型或模式。虽然数据库中的结构化数据更容易分类和管理,但很难知道视频或电子表格的内容是什么以及它是否包含密码或 PII。

这会产生数据治理风险——尤其是在医疗保健、金融服务和政府等高度监管的行业中,这些行业有义务遵守美国健康保险流通与责任法案 (HIPAA) 和萨班斯-奥克斯利法案等数据保护立法和法规法案(SOX)。

也存在安全隐患。许多现有的数据分类工具无法告诉您,例如,Word 文件是否被宏病毒感染。因此,您不仅需要能够对云环境中的非结构化数据进行分类并识别任何包含 PII 或敏感数据的数据,还需要能够扫描该信息以查找安全威胁。

云数据治理挑战

围绕非结构化数据造成数据治理挑战的另一个因素是云的广泛采用。所有这些数据不再存储在笔记本电脑、PC、文件服务器和网络附加存储 (NAS) 上,而是随着组织远离本地基础设施,现在存储在 Office 365 或 Google Workspace 等云平台中。许多公司甚至配置笔记本电脑和系统,因此员工只能将数据保存到 OneDrive。

但是在这次云迁移的过程中,组织并没有花时间整理他们的数据。这只是提升和转移。他们实际上是将一堆非结构化数据从一个地方移动到另一个地方。这只是移动问题,而不是解决围绕缺乏可见性的核心问题。

当然,也有市场上已经出现多年的数据分类工具。但它们没有跟上时代的步伐,也不是为云而设计的,因此在功能和能力上存在差距。一种工具可能会报告您的数据,但不会修复它。另一个将修复它并将其组织成更结构化的方式,但只能在一个平台上工作。

许多这些较旧的产品也不与最新的文件格式兼容,并且无法进行光学字符识别 (OCR)。例如,如果您想检查和分类诸如护照照片之类的东西,您需要 OCR 自动解析图像并将姓名、护照号码、地址和其他 PII 捕获为文本格式而不是图像格式。

您还需要一种现代工具,可以在分类时编辑任何个人或敏感信息。该工具需要为管理员检测和标记该信息,但对其进行编辑以使其无法查看。

非结构化数据的这种增长只会继续下去,组织必须掌握其云环境中的分类和治理,以便他们能够识别和保护敏感信息,并避免代价高昂或破坏性的安全和合规性违规。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值