spark streaming--可优化的点

最新推荐文章于 2022-10-10 13:26:42 发布

韩运畅

最新推荐文章于 2022-10-10 13:26:42 发布

阅读量172

点赞数

分类专栏： # Spark Streaming

本文链接：https://blog.csdn.net/qq_41634872/article/details/105918587

版权

Spark Streaming 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

                    
                    合理设置间隔时间，如果间隔时间过小，任务分发和提交带来的延迟副作用会变大
合理使用persist,将数据备份到内存或磁盘
控制batch size spark会将窗口间隔内的数据全部存入到内存，如果窗口过大，batch size过大，需要合理增加节点
即使清理不再使用的数据，以确保spark有足够的内存空间。前面已说spark会将数据全部缓存到内存中，我们可以设置spark.cleaner.ttl来及时清理超时的无用数据。