hadoop整体体系规划总结

最新推荐文章于 2023-08-04 00:33:59 发布

fish_cool

最新推荐文章于 2023-08-04 00:33:59 发布

阅读量1.9k

点赞数

分类专栏： hadoop 文章标签： hadoop pig python hbase jvm shell

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chenyi8888/article/details/7834018

版权

hadoop 专栏收录该内容

75 篇文章 0 订阅

订阅专栏

关于hadoop整体规划，根据我使用的经验来看，分成5个部分：

第一个部分hadoop部署与运维

第二个部分hadoop的文件系统

第三个部分hadoop的MR计算框架

第四个部分hadoop的第三方生态圈

第五个部分调度程序

第一部分有分为以下几个点：

操作系统安装、机器选型、hadoop的namenode部署、datanode部署、JVM选型与调试、hadoop运维（这包括容错、备份、恢复、增删节点等很多方面）、分布式部署、监控、调优（包括CPU、内存、IO、网络）、hadoop架构分布（namenode、jobtracker、datanode、tasktracker、SecondaryNameNode分布）、最后一点就是namenode的单点故障解决方案。

第二部分分为以下几个点：

简单的文件系统操作、权限管理、HDFS的参数配置与调试、压缩模式、序列化、HDFS的运行机制、文件系统原理、HDFS接口、文件存储格式。

第三部分分为以下几个点：

MR本身运行机制、调度器配置与调优、调度器原理、MR开发环境搭建并编写MR程序、MR的参数配置与调试（本地调试、远程调试、HPROF分析）、MR相关算法。

第四部分分为以下几个点：

hive、zookeeper、hbase、pig、sqoop、mahout等使用与应用。

第五个部分简单地说就是如何编写调度程序（用java、python、shell、crontab等都行）

如果每个点再细分，其实都是一块工作量很大的部分，而且各个部分其实又是紧密结合在一起的。

以上就是我使用hadoop体系以来的总结，根据这些方面，去招聘相关职位的工程师，互相配合。如有错误，请指正。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。