Hadoop学习笔记内容说明_00
1、 观看云帆大数据梦琪老师的《企业级 Hadoop 1.x 应用开发基础课程》2014年4月左右版本。
2、 博客是在梦琪老师的随堂笔记上改动的,方便的是自己以后回顾学习,也或许能给需要改方面帮助的同行提供些许帮助,在此非常感谢梦琪老师。
3、 本系列是在CentOS6.4+hadoop1.2.1上实验通过的。
4、 由于本人刚刚接触,对Linux也只是初步了解,实验过程中遇到比较奇葩的问题,也在此博客写出。
5、 云帆大数据官网公布了一些公开的视频资源,大家可以前往学习。
第一个专题
Linux 系统环境搭建和基本命令使用:上课使用虚拟机,CentOS 6.4 64 位操作系统,基本命令要 熟悉,一次课时。
第二至五个专题(Hadoop 1.x 系列的核心,基础)
Hadoop 本地(单机)模式和伪分布式模式安装:Hadoop 1.x 理论知识,架构体系,安装模式, 认识 HDFS 文件系统,运行 MapReduce 程序 WordCount,如何查看 Hadoop 源码,Hadoop 1.x 包的 结构等等,三次课时。
HDFS 的体系结构、Shell 操作、Java API 使用和应用案例:深入讲解 HDFS 相关内容,包括 HDFS 架构与设计,优缺点,如何存储文件;如何访问 HDFS 文件系统