Hive是Hadoop组态中的数据仓库,本质是将sql语句转换为MapReduce任务,所以Hive只是一个解析引擎,它的数据存储在hdfs上,元数据信息依托mysql数据库。在这里有一个小问题,为什么需要mysql关系数据库,因为hdfs存储的只是数据信息,而建表的时候是需要列名来查询的,因此要用mysql来建立表信息,当然也可以用其他的关系型数据库。在这里依托mysql数据库搭建Hive组件。
1. 安装MySQL服务器端和MySQL客户端;
•安装:
– yum install mysql
– yum install mysql-server
•启动:
– /etc/init.d/mysqld start
•设置用户名和密码:
– mysql admin -u root password ‘111111’
•测试登录是否成功:
– mysql -uroot -p111111
登录MySQL:(1)直接输入密码mysql -uroot -p111111 (2)用户和密码mysql -uroot –p,密码111111
退出MySQL:exit;或者quit;
2. 安装Hive
a.#Master
下载apache-hive-1.2.2-bin.tgz,并解压
wget http://mirror.bit.edu.cn/apache/hive/hive-1.2.2/apache-hive-1.2.2-bin.tar.gz
tar zxvf apache-hive-1.2.2-bin.tar.gz
b.修改Hive配置文件
#Master
cd apache-hive-1.2.2-bin/co