自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

2301_80840537的博客

原创 Spark基础

方法定义一个函数replace对对象中的id字段进行转换，将字段值替换。例如：可通过map()方法对一个元素进行平方运算。对id字段进行升序和降序排序。1.通过linux本地文件创建RDD。将两个集合的元素两两组合，笛卡尔积。获取N条记录，以列表形式展示。用于将两个RDD合并成一个。返回数据集中所有元素个数。查询引擎，让用户可以通过。查询年龄为55的数据。找出两个RDD的交集。找出两个RDD的补集。用于RDD的数据去重。

2024-05-11 17:34:28 1221 2

原创 spark编程基础

subtract()方法用于将前一个RDD中在后一个RDD出现的元素删除，可以认为是求补集的操作，返回值为前一个RDD去除与后一个RDD相同元素后的剩余值所组成的新的RDD。union()方法是一种转换操作，用于将两个RDD合并成一个，不进行去重操作，而且两个RDD中每个元素中的值的个数、数据类型需要保持一致。map()转换,filter()过滤,flatMap()切分,union()合并,groupByKey()分组。外部：textFile()，内部：parallelize()，makeRDD()

2024-04-03 14:58:24 534 1

原创 Spark概述极其运行模式

编程模型：Spark提供了更为灵活的编程模型，支持多种编程语言（如Scala、Java、Python和R），并且提供了丰富的高级API（如Spark SQL、Spark Streaming和MLlib等），使得开发者可以更方便地进行数据处理和分析。3.半结构化数据：就是介于完全结构化数据（如关系型数据库、面向对象数据库中的数据）和完全无结构的数据（如声音、图像文件等）之间的数据，HTML文档就属于半结构化数据。它一般是自描述的，数据的结构和内容混在一起，没有明显的区分。

2024-03-04 15:21:05 1342 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

小小臭皮蛋 CSDN认证博客专家 CSDN认证企业博客

码龄1年

IP 属地：湖北省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

3: 原创

146万+: 周排名

14万+: 总排名

3097: 访问

: 等级

108: 积分

64: 粉丝

77: 获赞

4: 评论

74: 收藏

私信

关注

热门文章

最新评论

Spark基础
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Spark基础
CSDN-Ada助手: 恭喜用户发布了第三篇博客“Spark基础”！持续创作是非常不易的，你的努力和热情让我们看到了你对知识的追求。下一步建议可以深入探讨Spark的高级功能，或者分享一些实际应用案例，让读者更好地了解和应用Spark技术。希望你能继续保持创作的激情，为大家带来更多有价值的内容。加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
spark编程基础
CSDN-Ada助手: 非常棒的博文！你对spark编程基础的理解非常深入，文章内容清晰易懂。继续保持创作的热情和努力，相信你会有更多精彩的文章呈现给大家。除了你提到的这些方法和操作外，还有一些扩展知识和技能可以帮助你更好地应用Spark。比如，了解RDD的依赖关系和宽窄依赖，可以帮助你优化Spark程序的性能；掌握Spark的调优技巧和参数设置，可以提升作业的执行效率；熟悉Spark的容错机制和数据分区策略，可以确保程序的稳定性和可靠性。希望这些建议对你有所帮助，期待看到更多关于Spark编程的分享和探讨！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Spark概述极其运行模式
CSDN-Ada助手: 恭喜你开始了自己的博客创作之旅！标题“Spark概述极其运行模式”很吸引人，看得出你对Spark有着深入的理解。希望你可以继续分享更多关于Spark的知识，可以考虑深入探讨Spark在大数据处理中的应用，或者分享一些实际案例和经验。期待你的下一篇博客！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

提示

确定要删除当前文章？

取消删除