自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

sgs_sgs_sgs的博客

原创 spark中RDD编程（java）

要实现自定义分区器，需要继承org.apache.spark.Partitioner类，并实现下面三个方法。（1）numPartitions: Int:返回创建出来的分区数。（2）getPartition(key: Any): Int:返回给定键的分区编号（0到numPartitions-1）。（3）equals():Java 判断相等性的标准方法。这个方法的实现非常重要，Spark需要用这个方法来检查你的分区器对象是否和其他分区器实例相同，这样Spark才可以判断两个RDD的分区方式是否相同。

2022-09-23 11:00:40 3358 2

原创 kafka详解

kafka的传统定义：kafka是一个分布式的基于发布\订阅模式的消息队列，主要用于大数据实时处理领域kafka的最新概念：kafka是一个开源的分布式事件流平台，（80%的公司都在用），用于高性能数据管道、流分析、数据集成和关键任务应用（1）生产者：向kafka集群发送数据（2）broker：启动的kafka集群（3）消费者：从kafka集群消费数据（4）zookeeper：帮助kafka实现分布式根据业务需求，可以自定义分区器。

2022-09-23 11:00:20 11253 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄4年

2
原创

31
点赞

174
收藏

9
粉丝

关注

私信

热门文章

最新评论

kafka详解
放风讲故事: 这是一篇高质量的好文，深度理解和清晰的表达方式使复杂的技术概念变得容易理解，值得收藏点赞。博主用心很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，期盼博主能够光顾我的博客，给予宝贵的指导！~
kafka详解
哪种语言最好: 应该是--from-beginning
kafka详解
哪种语言最好: 把主题中的数据都读取出来，命令少了一个"-"： [code=java] kafka-console-consumer.sh --bootstrap-server hadoop102:9092 --from beginning --topic first [/code]
spark中RDD编程（java）
acrosssocialman: 麻烦问一下这是尚硅谷的哪个课程啊
spark中RDD编程（java）
CSDN-Ada助手: 推荐 Java 技能树：https://edu.csdn.net/skill/java?utm_source=AI_act_java

提示

确定要删除当前文章？

取消删除