数据预处理

数据清洗 (1)缺失值(忽略,中心趋势度量,该类中心趋势度量,人工填写,使用全局变量填充 ,使用最可能的值填充) (2)离群点:数据光滑(分箱 (中位数光滑,极值光滑,均值光滑),回归,离群点检测:聚类) 数据集成 (1)实体识别 (2)冗余相关分析(标称数据 :卡方检验  数值型:协方...

2015-05-28 22:55:07

阅读数:360

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭