自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 数据清洗第二章知识点

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的不完整数据,重复数据以及错误数据等“脏”数据内容通过清洗转换操作转变为符合企业要求的数据,便于为企业的决策提供分析依据。一:基于ETL的数据清洗ETL是实现商务智能的核心和灵魂。 ETL的实现有多种方式,常见的方式有借助ETL工具、编写SQL语句、将ETL工具和SQL语句结合起来使用。 如果数据源为外部文件,就无法使用SQL语句进行数据清洗工作。二:ETL关键技术ETL关键技术一共有三个,分别是数据的抽取,

2022-12-04 20:54:55 816 2

原创 数据清洗第一章知识点

一:数据清洗的背景1. 数据质量数据质量是指在业务环境下,数据符合数据消费者的使用目的,能满足业务场景具体需求的程度。2. 数据质量的评价指标数据质量的评价指标主要包括数据的准确性、完整性、简洁性及适用性,其中数据的准确性、完整性、简洁性是为了保证数据的适用性。 适用性是评价数据质量的核心准则。3. 数据质量的问题分类数据质量的问题可以分为两类:一类是基于数据源的“脏”数据分类;另一类是基于数据清洗方式的“脏”数据分类。 ①基于数据源的“脏”数据质量问题可以分为两类,即单数据源问题和

2022-12-04 20:29:18 483

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除