《大数据预处理技术》课后习题_在“数据库连接”窗口中,在一个作业或转换范围内连接名称不能重复。

本文概述了数据归约、数据预处理在IT领域的关键概念,重点介绍了Kettle在ETL(抽取、转换、加载)过程中的应用,以及数据清洗中步骤、转换和参照表的作用。此外,还强调了代码可读性和维护性的重要性。
摘要由CSDN通过智能技术生成

C. 0.4

D. 0.5

正确答案: A:0.318;

9.  数据归约的方法有

A. 维归约

B. 数量归约

C. 数据压缩

D. 以上都是

正确答案: D:以上都是 ;

10.  从程序执行的角度看,()实际上是两个步骤线程之间进行数据行传输的缓存。这个缓存被称为()

A. 箭头、队列

B. 连线、内存

C. 跳、行集

D. 连接、行集

正确答案: C:跳、行集 ;

11.  以下说法错误的是

A. 数据预处理的主要流程为数据清理、数据集成、数据变换与数据归约.

B. 数据清理、数据集成、数据变换、数据归约这些步骤在数据预处理活动中必须顺序使用。

C. 冗余数据的删除既是一种数据清理形式,也是一种数据归约

D. 整个预处理过程要尽量人机结合,尤其要注重和客户以及专家多交流。

正确答案: B:数据清理、数据集成、数据变换、数据归约这些步骤在数据预处理活动中必须顺序使用。

12.  转换里的步骤通过()来连接

A. 箭头

B. 跳

C. 连线

D. 队列

正确答案: B:跳;

13.  下列方法不是数据变换的有

A. 光滑

B.  抽样

C. 规范化

D. 属性构造

正确答案: B: 抽样 ;

14.  Kettle使用图形化的方式定义复杂的ETL程序和工作流,所以被归类为()编程语言。

A. 控件化

B. 可视化

C. 图标化

D. 流程式

正确答案: B:可视化;

15.  在下表中,用同类样本属性的中心度量方法填充空缺值,空缺值应为()

A. 9000

B. 10000

C. 11000

D. 12000

A:9000 ;正确答案: A:9000 ;

16.  CSV文件是一种用()分割的文本文件。

A. 逗号

B. 空格

C. 分隔符

D. 分号

正确答案: C:分隔符 ;

17.  在运行转换时,一个线程运行一个步骤,所有步骤的线程几乎()运行

A. 异步

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值