自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 kettle 报错 Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF

kettle 报错 Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF

2025-08-26 16:12:08 474

原创 Gitlab配置方法保姆级教程:

8、配置本地的姓名、邮箱号,需要在gitlab的Edit Profile 找。10、找到空白文件夹,点Git Bash Here 进行初次建立本地仓库。9、回到Web UI 点击Code 点击Clone with SSH。1、在桌面单击右键,出现 Git GUI Here 标识 点击。4、点击Copy To Clipboard 复制本地公匙。3、点击右上Help 再次点击show SSH Key。6、点击头像 点击Edit profile。7、点击左侧SSH keys 进行配置。

2025-01-12 18:58:56 452

原创 sparkSQL SQL风格和DSL风格 代码表达

(orderBy 完全等于 sort,使用时 无区别)group by + 聚合函数。group by + 任意记录。group + 过滤。

2024-11-13 22:52:20 1224

原创 基础python 高级版(含代码)

(1)【类名】(2)【类名()】(3)【类名(object)】方式1语法:```class 类名:代码...```方式2语法:```class 类名():代码...```方式3语法:```class 类名(object): # 推荐代码...```# 1.类名pass# 2.类名()class Student(): # 删除()pass# 3.类名(object)class Phone(object): # 标准pass。

2024-11-12 08:55:44 1804

原创 大数据问答200问(有问必答)(三)

第三阶段:是对排序后的键值对调用reduce方法,键相等的键值对调用一次reduce方法(也可以称之为分组,key相同的分为一组,由于排过序了,所以相同的数据会排在一起)。定义:浅拷贝创建一个新对象,该对象与原对象具有相同的值,但对引用类型字段只会复制引用地址,而不复制实际的对象。Zookeeper的选举机制是指在Zookeeper集群中,当主节点(Leader)失效时,剩余的从节点会通过一次选举来选出新的主节点(Leader)的过程。第三阶段:调用Mapper类中的map方法处理数据,实现业务需求。

2024-10-25 10:46:34 1128

原创 SQL从年月日截取年月的4种方法

当公司给你一张有含有年月日的表,让你去统计每个月度的数据总额、平均值、最大最小值 你应该怎么做?这种方法好处,简单好用,忘记怎么用 直接使用between...and...这种方式可以将全局的日期截取成年月的形式,后续用where语句进行筛选过滤。这种方法好处,比较正规 使用data_format函数。这种方式好处,书写代码量少,模糊查询不用记当月日期。对比完优劣势,你更喜欢哪一种?

2024-10-17 10:32:18 7038 1

原创 大数据问答200问(有问必答)(二)

pymysql是Python的一个第三方模块,用于链接MySQL数据库,提供了强大的接口,可以在Python程序中执行各种数据库操作。

2024-10-02 17:58:58 1340

原创 大数据问答200问(有问必答)(一)

在函数内部定义了另外一个函数并返回这个内部函数作为对象,同时还保存了外层函数的状态信息。这个内部函数可以依赖外层函数的变量和参数,而且外层函数返回的是这个内部函数的引用。这种函数内部定义函数并返回的方式形成了闭包。

2024-09-25 10:59:00 1363

原创 SQL连续性问题:破解任意连续n问题

这个是有可能的,所以我们在 group by 的时候 要同时聚合(id-rn)和num 这样的话不会出现串台的情况。我们会发现 如果处于连续状态 id-rn会为相同的数字,但是有没有可能 不连续也会出现相同的数字呢?(3)row_number():产生连续且唯一的序列号,序号不会重复。(2)dense_rank():产生排序序号,有并列情况序号连续;(1)rank():产生排名序号,有并列情况序号不连续;例如:1,2,3,3,5,6。例如:1,2,3,3,4,5。例如:1,2,3,4,5,6。

2024-09-21 23:10:58 514

原创 python爬虫:从入门到入狱,一步到位(一)

的网页数据,采用response类的ok属性,如果成功就会返回该网页的源码,如果失败则会返回“请求失败”的语句。本篇幅为基础篇,主要讲解简单的伪装浏览器请求,HTML解析等。

2024-09-20 20:22:07 953 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除