Pycharm下连接hive的两种方式！！解决各种姿势报错

最新推荐文章于 2024-07-30 19:46:58 发布

WCL0520

最新推荐文章于 2024-07-30 19:46:58 发布

阅读量3.9k

点赞数

分类专栏：知识归纳环境搭建信息配置文章标签： hive python spark

本文链接：https://blog.csdn.net/WCL0520/article/details/111618684

版权

本文详细介绍了在Windows环境下，使用PyCharm通过Spark连接Hive进行数据操作的步骤，包括导入hive-site.xml配置文件，添加MySQL驱动，启动Spark服务，设置环境变量，以及解决跨平台连接问题。同时提供了通过代码配置Hive metastore连接URI的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

window pycharm下用spark连接hive操作数据
一、

在/opt/soft/spark234/conf下导入hive-site.xml

二、

把mysql的驱动包mysql-connector-java-5.1.38.jar拖入/opt/soft/spark234/jars

三、

sbin下 ./start-all.sh 启动spark服务
bin下 ./pyspark 开启软件

四、

执行命令 df = spark.sql(“select * from dws_events.dws_temp_uf_infos
limit 3”); df.show()
成功表示：Linux下spark连接hive成功

五、

window下解压spark包
在linux下的conf下内容全部拷贝到window下的conf中
把conf下的hive-site.xml中的地址改成虚拟机的地址在jar包中导入mysql驱动（mysql-connector-java-5.1.38.jar）

六、

window下配置环境变量
创建
SPARK_HOME
E:\spark-2.3.4-bin-hadoop2.6 配置path路径
path下 %SPARK_HOME%\bin

七、

跳过第六步可以通过参数设置
.config(“hive.metastore.uris”,“thrift://192.168.133.195:9083”)

八、
配置环境变量方式代码如下：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

WCL0520

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

pycharm使用pyhive连接hive

qq_34566673的博客

11-10

1828

导入pyhive from pyhive import hive if __name__ == '__main__': conn =hive.Connection(host="192.168.139.128",port="10000",username="root", database="hivereview",auth="NOSASL") cursor = conn.cursor() sql="select * from client_ext" curso

pycharm+anaconda 连接hive(python3)

belialxing的专栏

04-28

3069

通过两大神器，强强联合，轻松掌握python。 1、神器一 anaconda用作包管理.(python模块管理,当然不仅限python模块包的管理) anaconda下载地址:建议使用最新版本. https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 2、神器二 pycharm:IDE工具(开发工具) https://download....

参与评论您还未登录，请先登录后发表或查看评论

PyCharm操作访问Hive

weixin_53431582的博客

04-13

353

配置关键：1.Hive JDBC驱动，将驱动放在一个没有中文的路径下。2.HS2服务启动且可用。本质：Pycharm是一个Hive的客户端，经过JDBC协议去访问HS2服务。

pycharm如何连接hive数据库

weixin_44675033的博客

06-11

3382

话不多说上代码 pip install pyhive from pyhive import hive # 查询所有数据库 conn = hive.Connection(host='IP地址', username='用户名', database='数据库') # 可以理解为鼠标 cursor = conn.cursor() # 点击输入查询的语句语句跟sql一样比葫芦画瓢就OK cursor.execute('show databases') # 查询所有数据库 # 输出数据库的名字 for r

pycharm链接hive，并创建表格

l15670130307的博客

04-25

633

打开pycharm左上角的file，点击设置图标就是那个小扳手。选择中文就可以了，就是那个Chinese simple。主机那里写上主机的IP地址就可以了，我的用户是root。下面演示pycharm切换中文。选择Apache Hive。首先下载pycharm。首先保持联网状态，然后。接着点击左上角的数据库。接着在相应区域写上内容。选择老师让你们下好的。

Python：Windows版本Pycharm连接Linux hive

Joseph25的博客

03-22

1627

作为一个python菜鸡，任何一个步骤都不能放过，就怕后续遇到同样的问题无从下手 1，我用的是hadoop2.7，spark-2.4.5-hadoop2.7，Anaconda3.6，Pycharm专业版 2，将hive-site.xml，core-site.xml，hdfs-site.xml，yarn-site.xml，mapped-site.xml放到%Spark_HOME%conf/ 3...

idea（pycharm）连接hive问题汇总

qq_40273172的博客

07-22

2022

idea 连接hive各种报错解决。

解决python3 Pycharm上连接数据库时报错的问题

12-23

使用pyCharm+python3+pyMysql+mysql5.56 数据库连接： connect = pymysql.Connect(host='localhost',port=3333,user='root',passwd='root',db='circle',charset='utf-8'); 最后查看发现，在数据库连接时不需要编码...

如何解决pycharm调试报错的问题

09-16

在使用PyCharm进行Python项目开发时，遇到调试报错是一种常见的问题，这可能是由多种因素导致的。本文将深入探讨这些原因，并提供相应的解决方案。首先，一个常见的报错原因可能是包名或文件名与Python的内置模块...

解决PyCharm同目录下导入模块会报错的问题

09-20

总结来说，当遇到PyCharm同目录下导入模块报错的问题时，应检查并确认模块所在的目录是否已被标记为“Sources Root”。如果是在不同目录间导入，可以通过调整sys.path来解决问题。确保对Python的模块导入机制有清晰...

pycharm通过跳板机链接hive数据库

qq_15821487的博客

09-06

491

Python连接Hive实例教程

yqj234的专栏

08-07

2930

Python连接hive

zomrev的博客

05-30

1063

使用pyhive连接hive后，可以直接保存为数据框 import sys import pandas as pd from pyhive import hive username = 'xxx' password = 'yyy' queue = '队列名' conn = hive.connect( host='#ip', port=9999, usern...

大数据单机学习环境搭建(10)Pycharm中操作spark和hive

LMTX069的博客

05-20

3516

目录1.环境准备2.Pycharm连接Hive3.Pycharm执行py脚本3.1SparkSql操作数据的方式3.2一个完整的pyspark脚本 1.环境准备需要提前准备Hadoop、Hive、Spark和Anaconda，以及Pycharm连接Linux的Anaconda环境，具体见本人如下相关文章。 Hadoop本地单节点安装 Linux使用yum安装Mysql Hive单节点安装和启用 Spark单节点安装与pyspark使用 Linux单节点Anaconda安装和Pycharm连接另外，还可以

PySpark 连接Hive

05-14

8628

文章目录简介环境搭建与效果演示更细节的搭建方法搭建HDFS、Spark或hive的前提已经有了远程可访问的测试集群搭建hadoop2.7.2修改hadoop配置格...

【python 连接hive】python 连接hive

赖德发的博客

08-03

2091

一、需要安装模块 pip install sasl pip install thrift pip install thrift-sasl pip install pyhive Thrift，sasl 要求最新版本二、代码模块 # -*- encoding=utf-8 -*- import time time1=time.time() import pandas as pd from py...

运行spark任务操作hive时报错

心动的博客

07-30

262

将集群上面的/opt/installs/hadoop3.1.4/etc/hadoop/目录下的hdfs-site.xml中添加下面代码。注意将分布式集群上的都需要更改！

005 python连接hive

wz_cmyc的博客

08-12

435

python 连接hive

python3.5 连接hive（hive有密码并且集群Kerberos认证）基本使用 pyhive

weixin_41734687的博客

11-10

5211

pycharm 连接hive