pyspark向lzo格式hive表插入数据

最新推荐文章于 2020-12-23 16:56:31 发布

weixin_30902675

最新推荐文章于 2020-12-23 16:56:31 发布

阅读量188

点赞数

文章标签：大数据 python

原文链接：http://www.cnblogs.com/ychang/p/10478746.html

版权

1.在执行插入之前，必须要指定参数

spark.sql("set hive.exec.dynamic.partition.mode=nonstrict")
spark.sql('''set mapred.output.compress=true''')
spark.sql('''set hive.exec.compress.output=true''')
spark.sql('''setmapred.output.compression.codec=com.hadoop.compression.lzo.LzopCodec''')

insert_sql = '''
    insert overwrite table test partition(dt,hour) select * from tmp_view
'''
spark.sql(insert_sql)

说明，在pyspark里不像在python直接调用hive一样

from HiveTask import *
ht = HiveTask()
ht.exec_sql("adm",sql,lzo_path="true")

转载于:https://www.cnblogs.com/ychang/p/10478746.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30902675

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pyspark向lzo格式hive表插入数据

1.在执行插入之前，必须要指定参数spark.sql("set hive.exec.dynamic.partition.mode=nonstrict")spark.sql('''set mapred.output.compress=true''')spark.sql('''set hive.exec.compress.output=true''')spark.sql(''...
复制链接

扫一扫