前言:
Hive是一个基于Hadoop的数据仓库工具,以一种类SQL的HQL语句操作Hadoop数据仓库(HDFS等)。所以本地windows安装前需要先搭建Hadoop。前面文章已经大概介绍了环境搭建和踩坑汇总,所以这里也依旧只是介绍基础的安装方法。因为关于Hive的安装,网上其实有很多文章,这里更多的是小北在安装过程中的遇到的各种坑的汇总以及解决方法。
环境:
1.windows10
2.hadoop2.7.7
3.mysql-connector-java-5.1.7-bin.jar
4.hive2.1.1
简易安装:
1. Hadoop本地搭建
2. Hive下载安装,环境变量配置
3. Hive config配置
(1). 找到hive的conf下的以下四个文件再按下面方式修改。
4. 创建目录
(1). 先将mysql-connector-java-5.1.7-bin.jar文件移动到hive的lib中,如下。
(2). 现在hive根目录下创建一个my_hive再创建以下四个目录。
5. 修改hive-env.sh
(1). 找到hive的conf下的hive-env.sh并添加以下几个配置。
6. 修改hive-site.xml
(1). 找到hive的conf下的hive-site.xml。
(2). 修改以下几个选项。
7. 在Hadopp上创建HDFS目录
(1). 创建以下目录并授予777权限。
(2). 在hadoop控制台上查看。
8. 创建MySQL数据库
(1). 创建hive数据库,可以以命令或者navicat方式创建。
9. 启动 Hive metastore
(1). 安装完毕只需要启动一次,启动后Mysql的hive数据库会多出以下表格。
10. 启动hive
(1). 如果配置了hive环境变量,如果没有则进入hive目录的bin文件下,输入hive。
(2). 启动成功没有报错,示例创建一张表格,输入以下HQL语句创建。
(3). 进入hadoop的控制台就可以查看了。
11. HQL几个常见命令
报错合集
1. HiveConf of name hive.metastore.local does not exist
去除 <property> <name> hive.metastore.local</name> <value>true</value> </property>
2. Version information not found in metastore. hive.metastore.schema.verification is not enabled so recording the schema version 2.1.0
在hive数据库的version添加一条记录,如下
3. applying authorization policy on hive configuration: java.net.URISyntaxException: Relative path in absolute URI: {system:java.io.tmpdir%7D/%7Bsystem:user.name%7D Beeline version 2.1.1 by Apache Hive
打开hive-site.xml,找到hive.exec.local.scratchdir, 将带有system:的标识全部去掉,如下
4. hadoop的web控制台文件系统,打开某个目录报错: Permission denied: user=dr.who, access=READ_EXECUTE, inode="/tmp/hive/Administrator":Administrator:supergroup:drwx------
进入hadoop命令,输入hadoop fs -chmod 777 /tmp/hive
其他
Default数据仓库默认位置:hdfs上的:/user/hive/warehouse路径下
安利
QQ小程序: 实用工具箱