UDF很慢

最新推荐文章于 2022-10-16 11:29:32 发布

V丶Chao

最新推荐文章于 2022-10-16 11:29:32 发布

阅读量936

点赞数

文章标签： java python 编程语言人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011698800/article/details/107607855

版权

2018/04/23
大部分时候，都是用的spark内置的命令。什么记个数，什么做个sql，这种概念。
即使是上了我所有的数据集，也不会特别慢。
但是自从我上了这个udf之后，就变得很慢了。每次运行个二十多分钟，这个就有点没法忍受了。
但是还是不能理解，到底是什么部分导致我变慢了。这个阶段的优化的话，就真的是语言级别的优化了，整体说底层架构的东西已经都优化好了，但是对于语言来说，还是没有优化。
不过，话说回来，除了一个我自定义的函数，大部分语句还是那种pandas的统计数据的。

我感觉，一个比较重要的地方，就是我怎么去看这部分是耗时的，又怎么去优化。还是得去谷歌查，

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。