大家有没有觉得使用命令行来操作Hive有点太麻烦了呢!没错,就是很麻烦,所以本篇,咱们来实现一波Hive的可视化!
本文默认你已经在电脑上配置好了Hadoop + hive + spark的环境,如果没有的话,可以参考本系列的第一篇文章:使用Excel&Python&Hive&SparkSQL进行数据分析开篇-环境搭建攻略!
话不多说,搞起搞起!
1、配置hive-site.xml
说到可视化,其实就是通过一个客户端实现远程登录,并进行相关的操作。
这里需要使用hive中的HiveServer2服务,使用该服务相当于在hive的机器上启动一个server,而客户端可以通过ip + port的方式对其进行访问,然后,就可以通过客户端来实现我们可视化的需求。
所以,咱们先来配置一下ip和port,当然还有用户名和密码。打开hive-site.xml文件,修改下面几项:
设置访问ip,这里你可以自己设置相应的ip:
<property> <name>hive.server2.thrift.bind.host</name> <value>192.168.0.107</value> <description>Bind host on which to run the HiveServer2 Thrift service.</description> </property>
设置访问端口,一般设置为10000:
<property> <name>hive.server2.thrift.port</name> <value>10000</value> <description>Port number of HiveServer2 Thrift interface when hive.server2.transport.mode is 'binary'.</description> </property>