Flink Sql on Hive 的生产遇到的坑以及优化（持续更新 ...）

最新推荐文章于 2025-03-17 17:19:27 发布

FishMAN_已存在

最新推荐文章于 2025-03-17 17:19:27 发布

阅读量4.6k

点赞数

分类专栏： Flink生产实战！文章标签： flink hive 实时大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44500374/article/details/112610629

版权

1、HiveSource-xxxx.xxxx’s parallelism (200) is higher than the max parallelism (128). Please lower the parallelism or increase the max parallelism.

（1）报错

这是sql-cli 连接hive,查一张表报的错

[ERROR] Could not execute SQL statement. Reason:
org.apache.flink.runtime.JobException: Vertex Source: HiveSource-xxxx.xxxx's parallelism (200) is higher than the max parallelism (128). Please lower the parallelism or increase the max parallelism.

（2）解决

只需要改动flink包下的/conf包里sql-client-defaults.yaml这个文件里的max-parallelism改为300即可

execution:
  max-parallelism: 300

2、flink sql读取hive表时建议手动配置table.exec.hive.fallback-mapred-reader: true生效

（1）报错

不管用sql-cli，还是把sql放在代码里，执行以下sql都是下面的结果，同时报错都是报Caused by: java.lang.IllegalArgumentException。

而我用Spark Sql跑下面的Sql都是正常的。

（1）First:
SELECT vid From table_A WHERE datekey = '20210112' AND event = 'XXX' AND vid = 'aaaaaa';   (**OK**)
SELECT vid From table_A WHERE datekey = '2

最低0.47元/天解锁文章

FishMAN_已存在

博客等级

码龄6年

18
原创

15
点赞

71
收藏

26
粉丝

关注

私信

热门文章

分类专栏

Flink生产实战！ 13篇
运维 7篇
clickhouse 1篇
Iceberg 1篇
hadoop 5篇

展开全部收起

下一篇：: 最新版本Flink 1.12.0 的sql-cli配置连接yarn-session

最新评论

Flink任务日志写到kafka【最新1.12，1.13】
小小菜鸟丶: 您解决了吗，遇到了相同的问题？
Flink任务日志写到kafka【最新1.12，1.13】
qqaz2ws: 您好，请问这个问题你有解决吗
Flink任务日志写到kafka【最新1.12，1.13】
qqaz2ws: 楼主，问下把jobname配置在fink-conf.yaml中，那全部的job都是共用这一个jobname? 如何能达到区分的效果呢？
java.io.FileNotFoundException: File does not exist: hdfs://xxx
csdn_书剑: 意思是说 fs.default.name 设置错误，最有可能是本地测试忘记该配置了，“ 拿著別人正確的程式一點一點查,發現是因為有這句話: Configuration conf = new Configuration(); conf.set("fs.default.name", "hdfs://uat84:49100"); 這是什麼意思呢,就是說,你如果是本地跑,就是不引入mapred-site,yarn-site,core-site這些配置檔案, 那麼這個地方也不要設定,因為你是在本地跑M/R程式,( fs.default.name預設值是file:///,表示本地檔案系統) 這個地方卻又告訴hadoop,需要的jar包從hdfs中取,當然會報以上的問題。那麼,在本地跑直接去掉這句話就ok了。反之,如果你是提交到叢集,引入了mapred-site,yarn-site,卻沒有引入core-site,也沒有設定fs.default.name,那麼,因為不知道namenode的地址, 無法將job.jar提交到hadoop叢集上,因此會報如下錯誤: due to: File file:/tmp/hadoop-yarn/staging/hadoop/.staging/job_1397132528617_2814/job.jar does not exist .Failing this attempt.. Failing the application. 因此我們只要告訴hadoop我們的namenode地址就可以了。引入core-site或是設定 fs.default.name 都是一樣的”
最简单的clickhouse监控 —— grafana监控
梦痕长情: clickhouse的表的结构没给出来

大家在看

多服务器协同开发,多人协同一台电脑-代码审计——仙盟创梦IDE 153

最新文章

目录

展开全部

收起

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。