Data Managment: Oozle、Chukwa、Flume、zookeeper
Data Access:Hive、Pig、Mahout、Avto、Sqoop
Data Processing: MapReduce、YARN
Data Storage: HDFS、HBASE
Hive包括的四种数据类型:表(table)、外部表(External Table)、分区(partition)、桶(Buclet)
Hive的最佳使用场合:大数据集的批处理作业
Hive:抽象层工具,sql编程,让不熟悉MapReduce的人也能够编写数据查询语句
HDFS:Hadoop Distributed File System ==> hadoop分布式文件系统
HBASE:Hadoop Database ==> hadoop数据库
MapReduce:mapping reduce ==> 映射,化简,分布式,并行处理的编程模型。需要java编程
sqoop:连接工具,用在数据库,数据仓库,hadoop之间转移数据
-----------------------------------------day2 linux系统的安装-----------------------------------------