C. 0.4
D. 0.5
正确答案: A:0.318;
9. 数据归约的方法有
A. 维归约
B. 数量归约
C. 数据压缩
D. 以上都是
正确答案: D:以上都是 ;
10. 从程序执行的角度看,()实际上是两个步骤线程之间进行数据行传输的缓存。这个缓存被称为()
A. 箭头、队列
B. 连线、内存
C. 跳、行集
D. 连接、行集
正确答案: C:跳、行集 ;
11. 以下说法错误的是
A. 数据预处理的主要流程为数据清理、数据集成、数据变换与数据归约.
B. 数据清理、数据集成、数据变换、数据归约这些步骤在数据预处理活动中必须顺序使用。
C. 冗余数据的删除既是一种数据清理形式,也是一种数据归约
D. 整个预处理过程要尽量人机结合,尤其要注重和客户以及专家多交流。
正确答案: B:数据清理、数据集成、数据变换、数据归约这些步骤在数据预处理活动中必须顺序使用。
12. 转换里的步骤通过()来连接
A. 箭头
B. 跳
C. 连线
D. 队列
正确答案: B:跳;
13. 下列方法不是数据变换的有
A. 光滑
B. 抽样
C. 规范化
D. 属性构造
正确答案: B: 抽样 ;
14. Kettle使用图形化的方式定义复杂的ETL程序和工作流,所以被归类为()编程语言。
A. 控件化
B. 可视化
C. 图标化
D. 流程式
正确答案: B:可视化;
15. 在下表中,用同类样本属性的中心度量方法填充空缺值,空缺值应为()
A. 9000
B. 10000
C. 11000
D. 12000
A:9000 ;正确答案: A:9000 ;
16. CSV文件是一种用()分割的文本文件。
A. 逗号
B. 空格
C. 分隔符
D. 分号
正确答案: C:分隔符 ;
17. 在运行转换时,一个线程运行一个步骤,所有步骤的线程几乎()运行
A. 异步