分布式的数据仓库,结构化的数据文件映射为一张表,并提供类SQL查询功能。Hive的设计目的是让精通SQL技能但Java编程技能相对较弱的分析师能够对存放在HDFS中的大规模数据集执行查询
本质是:将HQL转化成MapReduce程序
1)Hive处理的数据存储在HDFS
2)Hive分析数据底层的实现是MapReduce
3)执行程序运行在Yarn上
下载:
http://archive.apache.org/dist/hive/
Hive集群安装(基于Mysql)
1)安装jdk(略)
2)安装hadoop(略)
3)安装mysql数据库(略)
yum install wget
wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm
[root@hadoopNode1 soft]# rpm -ivh mysql-community-release-el7-5.noarch.rpm
[root@hadoopNode1 soft]# yum install mysql-server
[root@hadoopNode1 soft]# systemctl start mysqld
[root@hadoopNode1 soft]# systemctl enable mysqld #启用系统服务
初始化root用户
mysql -u root
mysql>use mysql;
mysql> update user set password=password('123456') where us