![](https://img-blog.csdnimg.cn/20190918140053667.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据开发
文章平均质量分 87
数据开发知识记录
只要开始永远不晚
好好学习,天天向上!
展开
-
Spark bucketing bucket分桶原理和应用
介绍Spark分桶的原理以及如何在数据分析和数据准备中更好的应用分桶。原创 2022-08-24 13:09:04 · 2113 阅读 · 0 评论 -
Spark shuffle
Shuffle这个词其实可以翻译成『数据重分布』,Shuffle是Spark用于执行数据重分配的机制,以便对数据实现跨分区重新分组操作。这会导致跨执行器和机器的数据复制,因此它是一个复杂且消耗资源的操作。...原创 2022-08-05 17:54:05 · 568 阅读 · 0 评论 -
kafka-eagle配置指南
kafka-eagle配置指南原创 2022-07-22 19:28:49 · 1720 阅读 · 0 评论