一、代码错误
TypeError: '(slice(0, 10, None), slice(None, None, None))' is an invalid key
solution:操作的是dataframe,要用iloc【】提取行列,不能直接df【】
二、逻辑错误
min-max归一化后出现多个1和0
![](https://img-blog.csdnimg.cn/img_convert/03b6f949ab32c6da7db25e900f3b22b1.png)
说明数据离群值很多,不适合采用此类归一化。
总结在normalization时需注意的问题:
训练集、测试集分开norm,避免信息泄露
分析数据情况,采用合适的norm方法。
应该将整个数据集的全部属性一起norm,不应该每个sample分开norm或是每个特征集合分开norm。