(1) 数据清洗的目的是什么?有哪些常用的数据清洗处理?(10分)<br />
答:数据清洗的目的是删除重复信息,纠正存在在错误,并提供数据一致性。常用在数据清洗处理:缺失值处理;噪声平滑;异常值检测与处理。
(2) 按照教材介绍,数据集成后冗余数据分析常采用哪两种方法?(10分)<br />
答:卡方检验,利用数值数据的相关系数和协方差。
(3) 维归约是什么意思?我们学习了哪两种维归约方法?(10分)<br />
答:及减少数据维度(也称为属性,特征,列,变量)。
(4) 数据规范化的目的是什么?我们学了哪几种规范化方法?(10分)<br />
答:
(5) 数据离散化处理是什么意思?举例说明。(10分)<br />
答:
(6) 第四章综合实训中,用了哪些已学过的技术?分析中用到哪些目前还没有学过的知识?试归纳此综合案例的分析思路。(50分)<br />
答:2.清洗数据:缺失值处理;