自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_46893497的博客

博客等级

码龄5年

465
原创

603
点赞

2241
收藏

3640
粉丝

关注

私信

热门文章

分类专栏

up 5篇
数据仓库 11篇
大数据框架&技术相关面试题 10篇
大数据框架&技术相关图例 6篇
错误集锦 25篇
Hadoop 6篇
YARN 2篇
MapReduce 12篇
HDFS 8篇
hive 24篇
Hive函数 15篇
Hive函数实战 6篇
Spark 48篇
数据库
redis 17篇
hbase 21篇
doris 9篇
Kafka 13篇
一些杂项 24篇
Scala 22篇

最新评论

Spark--insert overwrite插入目标表慢/读取orc表执行时间比较长解决
韩家小志: 不insert，直接create临时表快吗
Spark--insert overwrite插入目标表慢/读取orc表执行时间比较长解决
NONAME_0: 这个参数，公司底层设置的就是1073741824
Spark--insert overwrite插入目标表慢/读取orc表执行时间比较长解决
NONAME_0: 我们用的是spark，不是spark on hive这类，设置了应该不生效吧。几千万数据，sql中也有逻辑处理，spark查询很快三分钟，但是一旦涉及到insert，就变成两三个小时了，甚至插入的还是orc表，执行计划中也有Batch：true的字样。而且，我去看sparkUI，有一个job，里边task平均五分钟，但是max是20分钟，然后我拿着那个taskid去dag图看，结果图上没有，有的taskId有，有的就没在图上显示，就没什么头绪了
Spark--insert overwrite插入目标表慢/读取orc表执行时间比较长解决
韩家小志: 可以参考Hive--控制map和reduce的个数(为什么&什么场景设置&如何设置
Spark--insert overwrite插入目标表慢/读取orc表执行时间比较长解决
韩家小志: 是不是单文件太大，reduce太少。可以调整下reduce个数，比如set hive.exec.reducers.bytes.per.reducer = 134217728。可以参考下https://blog.csdn.net/qq_46893497/article/details/113864209

hive

关注

文章平均质量分 77

之前喜欢自己做笔记，现在有时间就整理出来放这里

关注数：文章数：24 文章阅读量：58064 文章收藏量：245

作者: 韩家小志

这个作者很懒，什么都没留下…

展开

专栏收录文章