![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据清洗
文章平均质量分 70
Sakura Evan
这个作者很懒,什么都没留下…
展开
-
7.2 数据的批量加载
7.2 数据的批量加载原创 2022-11-27 13:23:41 · 305 阅读 · 1 评论 -
7.1 数据的加载机制(增量加载)
增量加载原创 2022-11-25 17:57:06 · 347 阅读 · 0 评论 -
7.1 数据的加载机制(全量加载)
全量加载原创 2022-11-25 17:04:06 · 237 阅读 · 0 评论 -
6.3 数据的商务规则计算
数据的商务规则计算原创 2022-11-24 19:06:34 · 361 阅读 · 0 评论 -
6.2 不一致数据的转换
不一致数据的转换原创 2022-11-22 17:56:02 · 90 阅读 · 0 评论 -
6.1 多数据源合并
多数据源合并原创 2022-11-22 17:19:56 · 954 阅读 · 0 评论 -
5.3 异常值处理(修补异常值)
修补异常值原创 2022-11-12 18:24:26 · 1156 阅读 · 0 评论 -
5.3 异常值处理(删除包含异常值的记录)
删除包含异常值的记录原创 2022-11-12 17:37:53 · 413 阅读 · 0 评论 -
5.2 缺失值处理(填充缺失值)
填充缺失值原创 2022-11-11 18:39:00 · 614 阅读 · 0 评论 -
5.2 缺失值处理(去除缺失值)
去除缺失值原创 2022-11-11 17:49:22 · 2551 阅读 · 0 评论 -
5.1 数据去重(不完全去重)
不完全去重原创 2022-11-09 20:00:00 · 83 阅读 · 0 评论 -
5.1 数据去重(完全去重)
完全去重原创 2022-11-09 19:01:14 · 436 阅读 · 0 评论 -
4.2 抽取Web数据
XML文件的数据抽取原创 2022-10-21 17:55:46 · 178 阅读 · 0 评论 -
4.2 抽取Web数据
HTML网页的数据抽取原创 2022-10-21 16:20:51 · 313 阅读 · 0 评论 -
4.1 抽取文本数据
抽取文本数据原创 2022-10-19 15:41:10 · 178 阅读 · 0 评论 -
3.4 kettle的基本功能
通过Kettle工具的作业来实现发送邮件。原创 2022-10-14 22:32:44 · 518 阅读 · 0 评论 -
3.4 kettle的基本功能
数据字段拼接原创 2022-10-14 21:33:51 · 391 阅读 · 0 评论 -
数据清洗笔记
1.1数据清洗的背景1.1.1数据质量概述 数据质量是指在业务环境下,数据符合数据消费者的目的,能满足业务场景具体需求的程度,数据消费者对数据质量各有各不同的观点。数据质量的显著特点如下: 1.“业务需求”会随时间变化,数据质量也会随时间变化。 2.数据质量可以借助信息系统度量,但独立于信息系统存在。 3.数据质量存在于数据的整个生命周期,随数据的产生而产生,随数据的消失而消失。1.1.2数据质量的评价指标 ...原创 2021-09-12 17:33:27 · 449 阅读 · 0 评论