Python 连接 Hive ,查询数据后,导出到csv文件

Python 连接 Hive ,查询数据后,导出到csv文件

导包

from impala.dbapi import connect
import os
import re
import csv
import time,datetime
import pandas as pd

开始时间

start = datetime.datetime.now()
print(“开始时间:” + time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(time.time())))

连接Hive

conn = connect(host=‘196.128.50.202’,port = 1000,auth_mechanism=‘PLAIN’)
cur=conn.cursor()

执行查询

cur.execute("SELECT * FROM table ")
i = 0
result = []

从结果中查出一条,然后循环下移cursor

row = cur.fetchone()
while row is not None:
i = i + 1
result.append(row)
row = cur.fetchone()
if i %10000==0:
df = pd.DataFrame(result)
df.to_csv(“D://gongshan

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要在 Python连接 Hive,需要使用 PyHive 这个包,它提供了 PythonHive 之间的连接接口。具体步骤如下: 1. 安装 PyHive 包,可以使用 pip 命令进行安装: ``` pip install PyHive ``` 2. 导入需要的包: ```python from pyhive import hive import pandas as pd ``` 3. 创建 Hive 连接: ```python conn = hive.Connection(host='localhost', port=10000, username='your_username') ``` 其中,`host` 表示 Hive 服务器的地址,`port` 表示 Hive 服务器的端口号,`username` 表示连接的用户名。 4. 执行 Hive 查询: ```python cursor = conn.cursor() cursor.execute('SELECT * FROM your_table') results = cursor.fetchall() ``` 这里使用 `SELECT` 语句查询数据表,`fetchall()` 方法获取所有查询结果。 5. 将查询结果转换成 Pandas DataFrame: ```python df = pd.DataFrame(results, columns=[desc[0] for desc in cursor.description]) ``` `cursor.description` 返回查询结果的元数据,其中包含列名和数据类型等信息,通过列表推导式可以获取所有列名,然后将查询结果转换成 Pandas DataFrame。 6. 关闭连接: ```python conn.close() ``` 不要忘记在使用完之后关闭连接。 完整代码如下: ```python from pyhive import hive import pandas as pd # 创建 Hive 连接 conn = hive.Connection(host='localhost', port=10000, username='your_username') # 执行 Hive 查询 cursor = conn.cursor() cursor.execute('SELECT * FROM your_table') results = cursor.fetchall() # 将查询结果转换成 Pandas DataFrame df = pd.DataFrame(results, columns=[desc[0] for desc in cursor.description]) # 关闭连接 conn.close() ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值