数据挖掘,就是从数据中学习到规律,再将学习到的规律对未知的数据进行预测。但是我们最开始获取的数据其中绝大多数是“有毛病”的,不利于后期进行分析,所以我们在分析前需要进行数据的预处理。sklearn.preprocessing
包提供了几个常用的函数和转换类,用它们将一个原始的特征向量转化为一个更适于数据分析的表示形式。一般来说,学习算法收益于数据集的标准形式。如果数据中存在异常点,稳健的数据规范或转换是更适合的。 本实训的目的是掌握好sklearn
中的数据预处理方法。
头歌平台(EduCoder)—— 数据挖掘算法原理与实践:数据预处理
最新推荐文章于 2024-06-24 11:40:14 发布
本文旨在介绍如何使用sklearn库进行数据预处理,包括标准化、非线性转换、归一化、离散值编码、生成多项式特征及估算缺失值等关键操作。通过这些方法,可以将原始数据转化为适合分析的形式,提高学习算法的效果。
摘要由CSDN通过智能技术生成