自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 Spark大数据处理讲课笔记4.8 Spark

使用Spark SQL实现词频统计使用Spark SQL计算总分与平均分使用Spark SQL实现分组排行榜使用Spark SQL统计每日新增用户主要讲解以上内容。

2023-06-09 10:39:52 95

原创 Spark大数据处理讲课笔记4.2 Spark SQL数据源 - 基本操作

load()方法和save()方法。load()方法可以加载外部数据源为一个DataFrame,save()方法可以将一个DataFrame写入指定的数据源。

2023-06-09 10:18:26 103

原创 Spark大数据处理讲课笔记4.2 Spark SQL数据源的基本操作

查看HDFS上/input目录里的house.csv文件,读取房源csv文件,得到房源数据帧,查看房源数据帧内容然后大家可以看到,house.csv文件第一行是字段名列表,但是转成数据帧之后,却成了第一条记录,这样显然是不合理的,怎么办呢?就需要用到option()方法来传递参数,告诉Spark第一行是表头header,而不是表记录。

2023-05-25 11:13:00 120

原创 Spark大数据处理笔记2.2搭建Spark

1.首先我们要安装安装Spark集群前,需要安装Hadoop环境(一)前提是安装配置好了JDK(查看JDK版本)

2023-04-03 09:47:09 85

原创 大数据学习课堂笔记1.6 续

列表和映射(Map)的添加删除和修改等操作

2023-03-23 10:18:26 50

原创 大数据处理笔记1.6,掌握Scala数据结构

对数组的基本操作(1.6)

2023-03-23 08:48:13 46

原创 大数据讲课笔记【HDFS的Shell操作】

HDFS的Shell操作

2022-12-10 17:26:37 123

原创 大数据讲课笔记续(5.1)

大数据讲课笔记续【5.1】

2022-12-10 14:51:13 73

原创 大数据讲课笔记 5.1

常规操作

2022-12-09 11:05:02 74

原创 使用java API 操作HDFS

使用java API 操作HDFS

2022-11-25 10:40:41 2493

原创 Hadoop集群测试笔记

Hadoop集群测试

2022-11-04 11:29:45 470

原创 数据表建表

数据表常规操作

2022-11-03 22:11:36 151

原创 数据清洗与 预处理周五笔记

虚拟机相关操作...

2022-10-16 18:00:08 433

原创 数据分析与处理

数据的分析和处理理论

2022-10-06 19:50:06 919

原创 《数据清洗预处理笔记》

数据清洗预处理

2022-09-28 20:13:53 423

原创 大数据课件笔记y

CentOS

2022-09-23 15:35:44 567 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除