hive产生的背景:
使用mapreduce来编程很不便,需要按照mr的接口模型来编写
hdfs上的文件必须使用mr来开发,无法使用类sql语言来完成
hive是什么?
hive的执行引擎:
hive on mr
hive on spark 等
hive体系架构:
、
hive部署架构:(hive只需要部署一个节点,关键点在于mysql需要主备部署)
hive环境搭建:
cdh官网:http://archive.cloudera.com/cdh5/cdh/5
版本:http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz
配置:
(1)进入 /etc/profile 配置hive的安装路径及bin位置
(2)安装一个mysql
(3)在hive的安装路径下的conf下配置 hive-env.sh.template 文件 配置下hadoop的安装路径
(4)上传mysql驱动包到hive的lib目录下
(5)配置一个hive-site.xml文件
<configuration>
<property
<name>javax.jdo.option.ConnectionURL</name> <value>jdbc://mysql://localhost:3306/sparksql?createDatabaseIfNotExist=true</value>
<configuration>
<property
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/sparksql?createDatabaseIfNotExist=true</value>
</property>
<property
<name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value>
</property>
<property
<name>javax.jdo.option.ConnectionUserName</name> <value>lc</value> //自己使用root用户链接不上
</property>
<property
<name>javax.jdo.option.ConnectionPassword</name> <value>123456</value>
</property>
</configuration>
(6)启动hive