自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 spark编程进阶--spark sql结构化数据,文件处理

join()方法--允许笛卡尔积操作,使用join(right:DataFrame)方法链接Rating和user两个DataFrame数据,查看前三条记录。select()方法--使用select方法查询user对象中userId及gender字段的数据,查看查询结果的前3条信息。sort()--用sort根据userId字段对user对象进行升序排序,查看结果的前3条信息。apply()方法--查询user对象中zip字段的数据,查看查询结果。selectExpr()--对指定字段进行特殊处理。

2024-05-12 18:01:05 462 1

原创 scala基础---spark编程基础

创建区间数组,生成数组(1,3,5,7,9)查看z数组中除了第一个元素外的其他元素。判断数组z是否包含元素"baiu"通过concat()方法连接数组。元素1,元素2,......)通过操作符"++"连接数组。查看数组z的第一个元素。

2024-05-12 14:02:22 402

原创 Spark编程基础

内部:parallelize(),makeRDD()外部:textFile()创建可以从外部和内部。

2024-04-02 18:10:58 135 1

原创 每天一点Spark

一认识Spark 1.Spark的发展历史 2.什么是Spark 3.Spark的特点 4.什么是结构化数据什么是非结构化数据二了解Spark运行架构与原理 1.了解Spark架构 2.了解Spark作业运行流程 3.了解Spark核心数据集PDD

2024-03-04 14:52:39 348 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除