![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据清洗学习笔记
文章平均质量分 67
肥嘟嘟か
大数据专业秃头少女一枚····
展开
-
数据清洗学习笔记-----第二章Kettle的基本使用
2.1 Kettle简介 Kettle是一款国外免费开源的轻量级ETL工具,是基于Java语言开发的。它主要由四个组件组成:SPoon:Kettle的集成开发环境,提供2.2Kettle的下载安装原创 2021-09-15 17:05:11 · 479 阅读 · 0 评论 -
数据清洗学习笔记-----第一章数据清洗概述
一、背景介绍 企业所拥有的数据仓库中的数据的来源是广泛的,数据类型也是多而繁杂的。因此数据经常不是我们想要的。数据可能存在一些不完整的情况或者有一些错误,重复的数据,那么我们需要对数据进行清洗来得到一个符合我们要求的数据集。二、什么是数据清洗? 数据清洗是从一个充满拼写错误、缺失值、异常值等问题的原始数据集通过数据转换、缺失处理等手段映射为一个符合质量要求的“新”数据集的过程。 数据清洗的原理是利用相关技术将“脏”数据转化为满足质量要求的数据。三、数据质量 1、定义:数据质量...原创 2021-09-08 17:31:00 · 535 阅读 · 0 评论