大数据概况及Hadoop生态系统

大数据概况

大数据概念

大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。

一、大数据特征:

  • 1、4V特征
    a)Volume(大数据量):90% 的数据是过去两年产生
    b)Velocity(速度快):数据增长速度快,时效性高
    c)Variety(多样化):数据种类和来源多样化
    结构化数据、半结构化数据、非结构化数据
    d)Value(价值密度低):需挖掘获取数据价值
  • 2、固有特征
    a)时效性
    b)不可变性

二、分布式计算
分布式计算将较大的数据分成小的部分进行处理。
在这里插入图片描述

Hadoop生态系统

Hadoop概念

一、Hadoop概念:

  • 1、Hadoop是一个开源分布式系统架构
    分布式文件系统HDFS——解决大数据存储
    分布式计算框架MapReduce——解决大数据计算
    分布式资源管理系统YARN
  • 2、处理海量数据的架构首选
  • 3、非常快得完成大数据计算任务
  • 4、已发展成为一个Hadoop生态圈

二、Hadoop发展及版本

  • 1、Hadoop起源于搜索引擎Apache Nutch
    创始人:Doug Cutting
    2004年 - 最初版本实施
    2008年 - 成为Apache顶级项目
  • 2、Hadoop发行版本
    社区版:Apache Hadoop
    Cloudera发行版:CDH
    Hortonworks发行版:HDP

三、Hadoop特点:

  • 1、高扩展性,可伸缩
  • 2、高可靠性(多副本机制,容错高)
  • 3、低成本
  • 4、无共享架构
  • 5、灵活,可存储任意类型数据
  • 6、开源,社区活跃

四、Hadoop与关系型数据库对比

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值