数据分析EPHS(3)-来试试Hive的可视化吧～

最新推荐文章于 2024-09-04 17:28:16 发布

悄悄的努力

最新推荐文章于 2024-09-04 17:28:16 发布

阅读量660

点赞数 1

本文链接：https://blog.csdn.net/weixin_38753230/article/details/95563567

版权

这篇博客介绍了如何实现Hive的可视化操作，通过配置hive-site.xml，启动hiveserver2服务，使用DBVisualizer客户端连接Hive，并进行Sql测试。文章详细讲解了配置过程和解决连接问题的步骤。

摘要由CSDN通过智能技术生成

大家有没有觉得使用命令行来操作Hive有点太麻烦了呢！没错，就是很麻烦，所以本篇，咱们来实现一波Hive的可视化！

本文默认你已经在电脑上配置好了Hadoop + hive + spark的环境，如果没有的话，可以参考本系列的第一篇文章：使用Excel&Python&Hive&SparkSQL进行数据分析开篇-环境搭建攻略！

话不多说，搞起搞起！

1、配置hive-site.xml

说到可视化，其实就是通过一个客户端实现远程登录，并进行相关的操作。

这里需要使用hive中的HiveServer2服务，使用该服务相当于在hive的机器上启动一个server，而客户端可以通过ip + port的方式对其进行访问，然后，就可以通过客户端来实现我们可视化的需求。

所以，咱们先来配置一下ip和port，当然还有用户名和密码。打开hive-site.xml文件，修改下面几项：

设置访问ip,这里你可以自己设置相应的ip：

<property>    <name>hive.server2.thrift.bind.host</name>    <value>192.168.0.107</value>    <description>Bind host on which to run the HiveServer2 Thrift service.</description>  </property>

设置访问端口，一般设置为10000:

<property>    <name>hive.server2.thrift.port</name>    <value>10000</value>    <description>Port number of HiveServer2 Thrift interface when hive.server2.transport.mode is 'binary'.</description>  </property>