前言
截止写这边文章前,已经学习了hadoop、hive、hbase、zookeeper、sqoop,后续还会学习Hadoop生态圈的其他模块内容,这篇文章的内容也会逐渐完善。下面我把学习中有必要去了解和掌握的和大家一起分享。
一、Hadoop生态
Hadoop
- Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
- 用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
- Hadoop核心组成:HDFS(分布式文件系统)、MapReduce(分布式计算模型)、Yarn(分布式资源调度框架)、Common(工具类)。
Hadoop生态圈
- 广义上指一个生态圈,泛指大数据技术相关的开源组件或产品,如hbase、hive、spark、pig、zookeeper、kafka、flume、phoenix、sqoop等。
二、生态圈模块
HDFS
# HDFS学习
MapReduce
Yarn
# Yarn学习
Zookeeper
Hive
# Hive基础
# Hive函数
Hbase
# HBase学习
Sqoop
Spark
PS:如果有写错或者写的不好的地方,欢迎各位大佬在评论区留下宝贵的意见或者建议,敬上!如果这篇博客对您有帮助,希望您可以顺手帮我点个赞!不胜感谢!
原创作者:wsjslient |