机器学习 数据特征预处理 特征同等重要时进行归一化或标准化 1、归一化 归一化缺点:如果数据中异常点较多,会使得某一特征对最终结果造成影响。 2、标准化 注:上边标准化特点 应该是标准差为1 归一化与标准化比较 3、缺失值处理 注:np.nan为float类型 4、数据降维(特征的数量) 1、特征选择:①过滤式 删除低方差的特征 2、主成分分析 API 过采样 把少数的变多