大数据安全

hadoop中没有中央服务器来认证用户,也没有安全网关或者认证机制。被授权可以访问NameNode的用户理论上能够删除数据或者假冒其他用户访问他们不应该访问的数据。 hadoop中也没有任何用于角色分配或对象层级访问的机制

Hadoop安全包括三个主要概念:

  • 验证(可用Kerberos)
  • 授权(可用Sentry)
  • 审计

既要保护静态数据、也要保护传输中的数据

0. Hadoop自带的用户权限体系

每个关键的hadoop守护进程需要在单独的用户下运行,需要的三个用户:

  • yarn 用户用于管理RM
  • mapred 用户用来管理mr服务
  • hdfs 用户用来管理HDFS文件系统

groupadd hadoop

useradd -g hadoop yarn # yarn owns the YARN  related services

useradd -g hadoop hdfs # hdfs ownsthe HDFS services

useradd -g hadoop mapred # mapred owns the MapReduce services

1. Kerberos

Kerberos是一个开源的网络身份验证协议,它假设主机是可信任的(但网络不是)

验证主要有3个步骤:

  • 认证服务器授予客户端要求访问Hadoop集群的授权票据(TGT)
  • 客户端使用它们的凭据解密TGT,并使用TGT从票证授予服务器(TGS)获取服务票证
  • 客户端使用TGS授予的服务票据来访问Hadoop集群
2. Apache Sentry

  • Linux下的用户,以及用户组
  • Hive的角色
  • 使用hue的用户
3. Apache Ranger

4. Apache Knox

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大数据安全服务是一项针对大数据环境下的安全威胁和风险进行预防和保障的服务。在大数据时代,公司和组织面临着海量数据的存储和处理,但同时也面临着数据泄露、数据篡改、数据丢失等安全问题。为了解决这些问题,大数据安全服务提供了一系列的解决方案和技术。 首先,大数据安全服务可以通过访问控制和权限管理来保证数据的机密性。通过严格控制用户对数据的访问权限,避免敏感数据被未经授权的人员访问,并采用加密技术对数据进行加密存储和传输,保证数据在传输和存储过程中的安全性。 其次,大数据安全服务可以通过数据审计和监控来及时发现和防范安全威胁。通过对数据的监控和分析,可以实时发现数据异常行为和安全事件,及时采取措施进行应对和防范,提高数据安全性和防护能力。 此外,大数据安全服务还可以通过数据备份和容灾技术来保障数据的可用性和完整性。通过定期备份和异地容灾,确保数据在发生故障或灾难时能够及时恢复,避免数据丢失和损坏。 最后,大数据安全服务还可以通过漏洞扫描和安全评估来识别和修复系统中的安全漏洞。通过定期扫描系统,及时发现并修复潜在的安全漏洞,减少安全风险和威胁。 综上所述,大数据安全服务在保障大数据环境下数据的安全性、完整性和可用性方面具有重要的作用。它可以帮助企业和组织预防和应对各种安全威胁,保护数据的安全,为大数据应用提供可靠的保障。在未来,随着大数据技术的进一步发展,大数据安全服务将不断创新和完善,以应对不断增长的安全挑战。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值