自学大数据(二)

学习方向

大数据解决了什么问题?

大数据需要解决得几个问题是

  • 采集
  • 存储
  • 计算
  • 展示
数据采集

说到数据采集就需要说到数据来源。数据无非来源于各种数据库,以及文件。那么就需要有提供一种这样得工具能从各个地方获取数据输入,并输出到HDFS中。
相信大家都接触过elk。也一定知道logstash。所以这里我推荐大家学习两个采集方案

  • 方案一、filebeat+kafka+logstash。
  • 方案二、flume+kafka
数据存储

Hadoop体系下:文件系统HDFS,依托于HDFS之上的有Hive、Hbase存储系统
Google体系下:文件系统GFS,依托于GFS之上的有bigTable存储系统

数据计算

数据的计算无可厚非就是分布式计算Map/Reduce。基于MapReduce上的计算引擎有Storm、Spark、Flink.

数据展示

展示自不必说了,大家想怎么展示就怎么展示了。当然如果你也可以使用一些第三方高大上的工具比如阿里的dataV、granfana,或者自己写的web。

总结

以上就是大数据体系下的核心技术,如果想学习大数据,就按以上技术体系深入了解就行了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值