数值型 归一化 标准化 类别 one-hot编码
缺乏归一化导致部分数据占较大权重,但实际上所有特征都是同等重要
求平方差是会导致尺度较大的数据的影响力进一步提升
Outliers会导致模型向异常方向偏移
标准化 减去平均数 除以标准差 数据的稳定性
有助于取消异常点
标准化对异常值鲁棒性高 适合现在嘈杂环境
插补缺失值 通过平均值 中位数可以按行和列来填补 一般以列也就是特征来填补
奇怪,我怎么记得1才是列S
数值型 归一化 标准化 类别 one-hot编码
缺乏归一化导致部分数据占较大权重,但实际上所有特征都是同等重要
求平方差是会导致尺度较大的数据的影响力进一步提升
Outliers会导致模型向异常方向偏移
标准化 减去平均数 除以标准差 数据的稳定性
有助于取消异常点
标准化对异常值鲁棒性高 适合现在嘈杂环境
插补缺失值 通过平均值 中位数可以按行和列来填补 一般以列也就是特征来填补
奇怪,我怎么记得1才是列S