free -m
所有的服务都依赖于zookeeper
启动HDFS
启动YARN
HA配置
启用high availability
namservice名称
namenode
JournalNode
存日志
13年hadoop2.2
hdfs 集群测试
/opt/cloudera/parcels/CDH/lib/hadoop-mapreduce
yarn jar hadoop-mapreduce-client-jobclient.jar
磁盘的好坏
网络的好坏
添加服务yarn
NodeManager本地目录,
更改内存大小
配置
资源管理
添加hive
GateWay把它当作客户端,配置文件
使用嵌入式数据库PostgreSQL 记住用户名:密码
sudo -u hive hdfs dfs -mkdir -p /usr/hive/warehouse
本人比较懒
under linux
hive
创建表
加载数据
desc formatted
desc dept;
under cdh
hive
配置
高级
hive.cli.print.header
ls /usr/bin -l