hadoop生态系统学习笔记
本系列主要介绍hadoop生态系统学习路线,此文仅作为学习笔记。
- 实验环境
- 本人使用两台win7 x64 为便于区分就称作pcA 和 pcB, 将pcA作为hadoop集群服务器使用(在此电脑中配置4台虚拟机),将pcB连接集群进行操作。
- 虚拟机:VMware Workstation 10.0.1
- 虚拟机中Linux系统为:ubuntu-14.04-desktop-amd64.iso
- hadoop版本:hadoop-2.7.4.tar.gz
- zookeeper版本:zookeeper-3.4.10.tar.gz
- hive版本:hive-2.3.2.tar.gz
- hbase版本:hbase-1.2.6.tar.gz
(均可在Apache官网下载,后续笔记中也会给出我的百度云盘下载地址)
章节设置
- 1、生态系统版本匹配
- 2、hadoop完全分布式安装配置
- 3、yarn集群配置
- 4、zookeep安装配置
- 5、hive安装配置
- 6、hbase安装配置
- 7、eclipse连接hadoop集群配置
- 8、Java编写wordcount代码(Eclipse)
- 9、hive整合hbase,向hbase导入CSV文件数据
- 10、待续