自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 头歌Spark SQL 多数据源操作(Scala)

{"id":1005,"name":"李晓玲","age":19,"class":"大数据一班"},{"id":1004,"name":"赵云","age":18,"class":"大数据一班"},{"id":1006,"name":"张惠","age":18,"class":"大数据二班"},{"id":1007,"name":"秦散","age":19,"class":"大数据二班"},{"id":1008,"name":"王丽","age":18,"class":"大数据二班"},

2025-04-25 15:55:54 1185

原创 头歌SparkSQL数据源

编程要求在右侧编辑器补充代码,把文件people、people1存在people路径下,通过id=1和id=2进行分区,以表格方式显示前20行内容。people.json、people1.json文件内容分别如下:{"age":21,"name":"张三", "salary":"3000"}{"age":22,"name":"李四", "salary":"4500"}{"age":23,"name":"王五", "salary":"7500"}代码实现.builder()

2025-04-21 17:35:17 1141

原创 配置 Conda 使用镜像源

反之,根据实操,单独虚拟环境的镜像源配置也会覆盖全局的镜像源,不过原先的配置文件(.condarc)还是存在的,因为我把原先的配置文件重命名为了.condarc_backup,一眼就发现了,【也就是说你还是可以根据修改配置的名字回到原先的配置(反推的,并未实践了,应该是没问题的)】如果你的虚拟环境中配置了阿里云镜像源,那么它会覆盖全局的镜像源配置。所以,当你在一个虚拟环境中配置了镜像源(比如清华大学镜像源),它会影响到所有虚拟环境的 Conda 操作。,它会优先应用,因此全局配置看似被虚拟环境的配置覆盖。

2025-04-14 18:44:01 1414

原创 nltk_data、punkt、punkt_tab下载及运用成功

实现步骤根据上述文章。

2025-04-07 17:35:03 454

原创 头歌scala集合的使用

接收给定的多行数据(例:4 \n 56 \n 5 \n -10 \n 10,其中第一个数代表列表长度,其余数代表具体值,\n 仅用来说明前一个数与另一个数之间是换行,实际数据中并没有);接收给定的多行数据(例:4 \n 56 \n 5 \n -10 \n 10,其中第一个数代表集合长度,其余数代表具体值,\n 仅用来说明前一个数与另一个数之间是。//counts:是一个映射(Map[String, Int]),其中键是单词,值是该单词出现的次数。,实际数据中并没有);

2025-03-18 23:15:25 542

原创 pandas缺失值填充--前填后填...

pandas缺失值填充_pandas填充缺失值-CSDN博客。最近的非缺失值填充。最近的非缺失值填充。

2024-11-13 11:07:06 382

原创 Pandas之inplace 参数

inplace 是 Pandas 中用于修改 DataFrame 或 Series 的一个参数。它用于决定是否在原始对象上直接进行修改,还是返回修改后的新对象。• inplace=True:表示在原始对象上直接进行修改,方法将不会返回一个新的对象,原始对象会被更新。• inplace=False(默认):表示不修改原始对象,而是返回一个修改后的新对象。

2024-11-06 11:08:15 230

原创 ValueError、TypeError

如果输入数据的形状不符合预期,可能会引发。

2024-10-23 18:36:47 150

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除