自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 7.2 数据的批量加载

7.2 数据的批量加载

2022-11-27 13:23:41 364

原创 7.1 数据的加载机制(增量加载)

增量加载

2022-11-25 17:57:06 416

原创 7.1 数据的加载机制(全量加载)

全量加载

2022-11-25 17:04:06 308

原创 6.3 数据的商务规则计算

数据的商务规则计算

2022-11-24 19:06:34 411

原创 6.2 不一致数据的转换

不一致数据的转换

2022-11-22 17:56:02 154

原创 6.1 多数据源合并

多数据源合并

2022-11-22 17:19:56 1198

原创 5.3 异常值处理(修补异常值)

修补异常值

2022-11-12 18:24:26 1410

原创 5.3 异常值处理(删除包含异常值的记录)

删除包含异常值的记录

2022-11-12 17:37:53 499

原创 5.2 缺失值处理(填充缺失值)

填充缺失值

2022-11-11 18:39:00 833

原创 5.2 缺失值处理(去除缺失值)

去除缺失值

2022-11-11 17:49:22 2791

原创 5.1 数据去重(不完全去重)

不完全去重

2022-11-09 20:00:00 149

原创 5.1 数据去重(完全去重)

完全去重

2022-11-09 19:01:14 544

原创 4.2 抽取Web数据

XML文件的数据抽取

2022-10-21 17:55:46 251

原创 4.2 抽取Web数据

HTML网页的数据抽取

2022-10-21 16:20:51 454

原创 4.1 抽取文本数据

抽取文本数据

2022-10-19 15:41:10 244

原创 3.4 kettle的基本功能

通过Kettle工具的作业来实现发送邮件。

2022-10-14 22:32:44 684

原创 3.4 kettle的基本功能

数据字段拼接

2022-10-14 21:33:51 433

原创 数据清洗笔记

1.1数据清洗的背景1.1.1数据质量概述 数据质量是指在业务环境下,数据符合数据消费者的目的,能满足业务场景具体需求的程度,数据消费者对数据质量各有各不同的观点。数据质量的显著特点如下: 1.“业务需求”会随时间变化,数据质量也会随时间变化。 2.数据质量可以借助信息系统度量,但独立于信息系统存在。 3.数据质量存在于数据的整个生命周期,随数据的产生而产生,随数据的消失而消失。1.1.2数据质量的评价指标 ...

2021-09-12 17:33:27 568

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除