spark直接写hive表速度慢

最新推荐文章于 2023-12-05 23:27:49 发布

盛源_01

最新推荐文章于 2023-12-05 23:27:49 发布

阅读量3.6k

点赞数 1

分类专栏： spark hive 文章标签： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40829577/article/details/109094526

版权

spark 同时被 2 个专栏收录

22 篇文章 1 订阅

订阅专栏

8 篇文章 1 订阅

订阅专栏

1. sparksql动态分区直接写入hive表速度慢

1 动态写入速度慢的sql

set hive.exec.dynamic.partition.mode=nonstrict;
insert overwrite table ssjt_test partition(dt) select a,dt from ssjt.test2 where dt>='20200801';

2. 文件方式写入后, alter方式添加分区
1) 过滤出要删除的目录;
2) 删除要重新覆盖的目录;
3) 文件方式写入(append)
import org.apache.spark.sql._
val out_path = "s3://transsion-bigdata-warehouse/test/shy/bak4"
df.write.mode( "append" ).option( "compression", "snappy" ).partitionBy( "dt" ).parquet( out_path )
4) 添加分区, 如果以前添加过可以省略;

2 新的解决思路参考

spark写入hive表发生NativeFileSystem:rename过程_盛源的博客-CSDN博客

-

-

-

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
spark直接写hive表速度慢

1. sparksql动态分区直接写入hive表速度慢1 动态写入速度慢的sqlset hive.exec.dynamic.partition.mode=nonstrict;insert overwrite table ssjt_test partition(dt) select a,dt from ssjt.test2 where dt>='20200801';2. 文件方式写入后, alter方式添加分区1) 过滤出要删除的目录;2) 删除要重新覆盖的目录;3) 文件方式写入(
复制链接

扫一扫

专栏目录

盛源_01 CSDN认证博客专家 CSDN认证企业博客

码龄7年

90: 原创

12万+: 周排名

2万+: 总排名

16万+: 访问

: 等级

1487: 积分

31: 粉丝

59: 获赞

17: 评论

226: 收藏

私信

关注

热门文章

分类专栏

hadoop 1篇
对象存储
Kafka
调度系统 1篇
airflow 4篇
spark 22篇
flink 8篇
IntelliJ_IDEA
通用类 8篇
数据质量 1篇
scala 1篇
大数据开发规范 3篇
waterdrop 1篇
presto 1篇
clickhouse 1篇
aws
Hbase
笔记 1篇
others
common 1篇
directory 4篇
python 5篇
java 2篇
linux 5篇
hive 8篇

最新评论

本地文件加载到hive表
CSDN-Ada助手: Hive 是否支持多表关联查询？
spark-sql读写数据源
CSDN-Ada助手: 大数据里的5V分别表示什么：Volume, Velocity, Variety, Veracity, Value?
spark日期时间处理
菜菜的大数据开发之路: 博主，我们互粉吧，大家一起加油，一起努力进步呀？
spark字符串操作处理
CSDN-Ada助手: 大数据包含结构化数据，非结构化数据，半结构化数据，怎么理解结构化？
spark-小文件优化
海洋饼干1126: 不适合buket表

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。