自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

kkyyy1的博客

原创 spark第二章到第五章全操作实操代码精简大全

程序运行过程中值不会发生变化的量通过val定义。

2024-05-13 12:30:47 919 1

原创 spark RDD方法实操

创建rdd4，先用filter()方法过滤去除100以下的数据，再用distinct()方法去重输出。创建g_rdd1，用groupByKey()方法对具有相同的值进行分组，将相同键的值的数量输出。创建rdd6，先用distinct()方法去再用cartesian()方法输出笛卡尔积。创建rdd1与rdd2，用union()方法合并rdd1与rdd2放在rdd3中。创建rdd1与rdd2，用union()方法合并rdd1与rdd2放在rdd4中。创建rdd5，用filter()方法过滤去除3以下的数据。

2024-05-13 12:13:01 824 1

原创了解spark框架及运行原理

所有Stage都完成后作业结束。aggregate(zeroValue, seqOp, combOp): 使用给定的函数对 RDD 的元素进行聚合，seqOp 计算在分区中初始值到中间结果的聚合计算，而 combOp 在节点上对中间结果进行聚合。union(otherRDD): 返回对输入 RDD 和参数 RDD 执行联合操作的结果，生成一个新的 RDD，不去重。窄依赖：表现为一个父RDD的分区对应于一个子RDD的分区或者多个父RDD的分区对应于一个子RDD的分区。

2024-05-13 12:06:46 459 1

原创终极核心大数据技术之认识spark

比如，Spark可以使用Hadoop的YARN和Apache Mesos作为它的资源管理和调度器，器，并且可以处理所有Hadoop支持的数据，包括HDFS、HBase和Cassandra等。RDD是一个抽象的概念，一个逻辑上的数据结构，中文全称是弹性分布式数据集，最直接的理解就是一个大的dataframe——这个dataframe可能是所有机器上原始数据的总和，也可能是中间计算到某一步得到的一个中间结果形成的dataframe。有些人说Spark的出现代表着Hadoop的死亡，这个观点我是不认同的。

2024-03-04 15:00:05 709 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

kkyyy1 CSDN认证博客专家 CSDN认证企业博客

码龄1年

IP 属地：湖北省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

4: 原创

163万+: 周排名

16万+: 总排名

2910: 访问

: 等级

92: 积分

46: 粉丝

51: 获赞

4: 评论

70: 收藏

私信

关注

热门文章

最新评论

了解spark框架及运行原理
CSDN-Ada助手: 非常棒的博客！了解Spark框架及其运行原理对于提升大数据处理能力非常重要。你对Stage、aggregate和union等关键概念的解释简洁明了，希望你可以继续分享更多关于Spark的知识。另外，在深入学习Spark的过程中，建议你了解一下Spark的调优技巧，如调整并行度、合理设置内存分配等，这些技能可以帮助你更好地优化Spark作业的性能。期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
spark RDD方法实操
CSDN-Ada助手: 恭喜用户发布了第三篇博客“spark RDD方法实操”！持续创作是提升自己能力和分享知识的好途径，希望您能坚持下去，多分享实操经验和技巧。下一步可以考虑深入探讨一些高级技术或者与实际项目结合的案例分析，这样可以吸引更多读者关注。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
spark第二章到第五章全操作实操代码精简大全
CSDN-Ada助手: 恭喜作者发布了第四篇博客，“spark第二章到第五章全操作实操代码精简大全”，内容丰富实用，对读者们学习Spark应该会有很大帮助。希望作者能够继续坚持创作，分享更多有价值的内容。下一步建议可以考虑结合实际案例或者应用场景，让读者更好地理解和运用所学知识。期待作者的更多精彩作品！继续加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
终极核心大数据技术之认识spark
CSDN-Ada助手: 恭喜你开始了博客创作之旅！标题“终极核心大数据技术之认识spark”听起来非常吸引人，我期待能够从你的文章中学习到关于Spark的知识。希望你能够继续分享更多关于大数据技术的见解和经验，让读者受益匪浅。同时也建议你在文章中多加入一些实际案例或者操作经验，这样能够更加生动地展现你的观点。加油！期待你的下一篇作品！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

提示

确定要删除当前文章？

取消删除