补充一点记录

Anla Likes Sunshine

已于 2022-02-24 15:13:52 修改

阅读量674

点赞数 1

分类专栏：大数据文章标签： hive hadoop hdfs

于 2021-07-02 15:03:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AnlaGodness/article/details/118151966

版权

1、spark sql报错：Error in query: nondeterministic expressions are only allowed in。
原理：rand()等函数不能出现在join…on的后面，使用rand()函数一般解决数据倾斜的问题
如何处理：在sparksql 就直接 join on 随机值字段。

2、杀进程：
2.1、

ps -ef | grep tomcat | grep -v "grep" | awk '{print $2}'
kill -9 $id

2.2、推荐：在airflow页面点击指定任务，查看application号后，输入指令：yarn application -kill application_1231243523

3、hive和impala 不支持多个count(distinct filed),如 select key,count(distinct field1),count(distinct field2),...
如何处理：改写为多个子查询然后join，比如

select a.key, a.count_a, b.count_b from
(select key, count(distinct column_a) count_a from test_table group by key) a join
(

最低0.47元/天解锁文章

Anla Likes Sunshine

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
补充一点记录

1、spark sql报错：Error in query: nondeterministic expressions are only allowed in。原理：rand()等函数不能出现在join…on的后面，使用rand()函数一般解决数据倾斜的问题如何处理：在sparksql 就直接 join on 随机值字段。2、杀进程：2.1、ps -ef | grep tomcat | grep -v "grep" | awk '{print $2}'kill -9 $id 2.2、推荐：
复制链接

扫一扫

专栏目录

Anla Likes Sunshine CSDN认证博客专家 CSDN认证企业博客

码龄8年

112: 原创

31万+: 周排名

186万+: 总排名

10万+: 访问

: 等级

1147: 积分

56: 粉丝

27: 获赞

10: 评论

51: 收藏

私信

关注

热门文章

分类专栏

大数据 48篇
金融 1篇
笔记 24篇
英语 10篇
学习方法探索 21篇
数据分析 4篇
hive 11篇
数据仓库 4篇
python 2篇
面试 1篇

最新评论

杂记3_first_value窗口+表追加指标开发+中位数+ntile窗口开发
尘雨: select appx_median(score) from (select 20 as score union all select 50 as score union all select 40 as score) t ;--40 impala 这个函数求算中位数不准的，当数字序列是奇数行时，没错，如果是偶数行。就错了如下这个sql是 20，30， 40， 50这样的数列，中位数应该是 35 =（30+40）/ 2。第2和第3 位置所在两个数值的平均值。而不是如下函数的算出来的40 select appx_median(score) from (select 20 as score union all select 30 as score union all select 50 as score union all select 40 as score) t ;
开发记录--create table as select的问题、array类型字段
一只赖沟霸: impala不能查询array，那么有没有可替代方案，不能光记录问题，也要寻求方法
sqoop数据倾斜解决实战
Anla Likes Sunshine: 是的
sqoop数据倾斜解决实战
海边看花开: solutionB 中的 index2 是表自带的？
hive_shell_mysql_python.杂记
cv君: 写得不错

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。