大数据入门之大数据简介及Hadoop环境的搭建(一)

一,大数据的概念

  • 从字面上可以理解,大数据就是数据量比较大,用传统的工具处理不了。
  • 大数据的数据量复杂,多样性。例如 数据包括 图片,视频,文字等。
  • 速度快。通过分布式存储,分布式计算,云计算等工具进行快速的处理。
  • 具有高度分析的新价值。通过海量的数据,进行分析判断,为个人或者企业的行动作出决策。

二,大数据带来的技术变革

  • 存储:文件存储==》分布式存储
  • 计算:单机==》分布式计算
  • 网络:万兆
  • 数据库:关系型数据库==》nosql(Redis,Mogodb…)
  • 数据采集:Flume,Sqoop
  • 数据存储,分析,挖掘,处理:Hadoop,Spark,Flink…

三,Hadoop介绍

  • Hadoop命名的由来。作者的孩子给一个玩具起的名字,读音比较好记。
  • Hadoop是一个适合大数据分布式存储(HDFS),分布式计算(MapReduce)和资源调度平台(YARN)。它主要实现下面的三个模块。
  • 分布式文件系统:HDFS实现将文件分布式存储在很多的服务器上。
    1,支持大规模文件存储 一个大文件可以拆分成若干个文件块,不同的文件块分发到不同的节点上。
    2,简化系
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值