Hadoop 3.x

Hadoop 3.x

1、大数据与Hadoop概述

  1. 大数据简介

    • 是一种数据规模大到在获取、存储、管理、分析等方面大大超出传统关系型数据库软件工具能力范围的数据集合,处理室需要采用新的分布式处理技术
    • 四大特征
      • 海量的数据规模
      • 快速的数据流转
      • 多样的数据类型
      • 价值密度低
    • 5V 特点
      • Volume大量
      • Velocity高速
      • Variety多样
      • Value价值
      • Veracity真实性
  2. 大数据典型应用

    运营商业务、金融业务、政务业务、交通领域业务、电子商务业务、科学研究业务、教育领域业务、健康医疗领域业务

  3. Hadoop简介

    • 是Apache软件基金会开发的分布式系统基础架构
    • Hadoop不是一套孤立的系统,具有很多生态子项目的支撑。
    • Hadoop框架的核心设计就是 HDFS(数据存储) 和 MapReduce(数据计算)
    • 五大优点
      • 高可靠性 --> 维护多个工作数据副本
      • 高扩展性 --> 在集群间分配数据完成计算
      • 高效性 --> 并行工作,能够在节点之间动态的移动数据
      • 高容错性 --> 可将失败的任务重新分配
      • 低成本 --> 开源
  4. Hadoop组成

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值