大数据基本是在Linux系统下操作,所以,学习大数据首先学的是Linux
1.Linux学习(首先认识Linux):
如何使用vmware安装linux镜像
认识linux的桌面环境、shell环境
在shell环境下进行文件系统的操作,掌握more、touch、cp、mv、rm等20多个常用命令
学习linux的网络管理,掌握ip、hostname等设置
学习vmware与linux的通信设置,掌握如何实现host-only、bridge、nat等网络连接方式
学习linux的进程管理,掌握如何查看、删除进程
学习linux的软件管理,掌握java、mysql等安装
学习环境变量配置,掌握如何设置环境变量
学习linux的ssh管理,掌握如何实现免密码登录
学习linux的防火墙管理,掌握如何关闭防火墙及开放指定端口
学习linux的调度管理,掌握crontab的使用
2.hadoop2学习(未细化):
搭建伪分布实验环境
HDFS体系结构及shell、java操作方式
MapReduce体系结构及各种算法
3.zookeeper学习
Zookeeper是什么
搭建zookeeper集群环境
如何使用命令行操作zookeeper
如何使用java操作zookeeper
4.HBase学习
hbase的概述
hbase的数据模型
hbase的表设计
hbase的伪分布式和集群安装
hbase的shell操作
hbase的JavaAPI操作
hbase的数据迁移
hbase的数据备份及恢复
Hbase结合Hive使用
hbase的集群管理
hbase的性能调优
5.CM+CDH集群管理学习
CM + CDH集群的安装
基于CM主机及各种服务组件的管理
CDH集群的配置和参数调优
CDH集群HA配置及集群升级
CM的监控管理
集群管理的注意事项
我会持续更新,如果想学习的,可以加群