Hive是基于Hadoop的一个数据仓库工具,将繁琐的MapReduce程序变成了简单方便的SQL语句实现,可以将结构化的数据文件映射为一张数据库表,可以将sql语句转换为MapReduce任务进行运行
注意Hive是数据仓库工具,不是数据仓库
hive是做hadoop数据分析用的
安装Hive之前首先要确保hadoop集群搭建成功
hive启动前必须启动hadoop和yarn
Hive的配置和基本用法
初次入门就先不去配置mysql了,即用内置derby版
运行 在bin目录下
./hive
语法绝大部分和mysql一样
此时看HDFS
可以看到,在Hive中建表的操作是会建立在HDFS上