数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。 1 数据清洗 数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值。 参考文档和完整的文档和源码下载地址: https://www.write-bug.com/article/1935.html