笔记
weixin_53892605
这个作者很懒,什么都没留下…
展开
-
转换与作业-简单的例子
1.转换 转换是ETL解决方案中重要的组成部分之一,主要用于数据的抽取、转换以及加载等操作,其本质是一组图形化的数据转换配置的逻辑结构。 下面通过一个简单的例子来讲解转换。 双击Kettle目录下的Spoon.bat脚本,启动Kettle工具,在工具栏处选择“文件”-“新建”-“转换”命令,创建一个转换,默认名称为“转换1”,如图1.1所示。 在Kettle主界面的工作区右击空白处,从弹出的快捷菜单中选择“新建注释”命令,并添加注释的内容...原创 2021-09-21 19:28:06 · 115 阅读 · 0 评论 -
数据清洗概述
1.数据质量的概述 数据质量是指在业务环境下,数据符合数据消费者的使用目的,能满足业务场景具体需求的程度,且在不同的业务场景中,数据消费者对数据质量有各自不同的观点。 数据质量的特点有以下三点: (1)“业务需求”会随时间变化,数据质量也会随时间变化。 (2)数据质量可以借助信息系统度量,但独立于信息系统的存在。 (3)数据质量存在于数据的整个生命周期,锁着数据的产生而产生,随着数据的消失而消失。 2.数据质量的评价标准 (1)准确性:要求数据中的噪声尽可能少。 (2)完整...原创 2021-09-12 17:36:56 · 1287 阅读 · 0 评论