大数据技术复习--大数据处理与大数据安全

分布式计算架构

RAS(reliability, availability, serviceability):最初来自IBM公司为其大型主机所做的宣传广告,强调主机系统的坚韧强固,即稳定性、可用性、可服务性

基于MapReduce批处理计算架构

在这里插入图片描述

MPI信息传递接口,一种典型的并行编程框架

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
MapReduce任务流程
在这里插入图片描述

基于Spark分布式内存计算架构

Mahout:基于Hadoop的机器学习和数据挖掘的一个分布式框架,Mahout用MapReduce实现了部分数据挖掘算法,解决了并行挖掘的问题
Hama:基于大批量同步并行策略的大数据分析分布式计算框架,可用于高级和复杂的计算,例如图形、网络算法和矩阵

在这里插入图片描述
在这里插入图片描述

静态数据与流数据区别:

  • 支持决策分析而构建的数据仓库系统,存放的大量历史数据就是静态数据
  • 在Web应用、网络监控、传感检测等领域,兴起的一种新的数据密集型应用就是流数据

大数据安全

大数据安全存在的典型问题:

  1. 认证授权问题:许多大数据平台没能实现有效的认证授权问题,从而导致未授权的文件访问等
  2. 访问控制问题:相对于传统的关系型数据库,目前大数据平台难以实现细粒化的数据访问控制。导致许多大数据系统为了不影响业务正常运行,只能指定非常粗粒度的访问控制策略
  3. 操作审计问题:目前大数据系统难以实现有效的审计。主要是操作记录存储分散,且记录往往过于简单,为后续分析带来了不便
  4. 敏感数据保护问题:开放的平台增加了数据泄露的风险,因此需要对敏感数据进行保护

在这里插入图片描述

处理加速技术:

  • GPU:是拥有一个由数以千计的更小更高效的核心组成的大规模并行计算架构
  • TPU:张量处理器
  • FPGA:现场可编程逻辑闸阵列FPGA
  • 5
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ˇasushiro

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值