使用sklearn preprocessing进行数据预处理
在机器学习中,我们尽量的把数据转成均值为0,方差为1满足高斯分布的数据,这样的好处使得数据比较均衡,算法不会因为某一个奇异的数据值而更偏向某一个数据。但是实际的情况中,我们通常不会太多的考虑数据的分布情况,而是通过均值集中数据,然后除以他们的标准差。
一.标准化,减均值,按照方差等比缩放
数据的标准化:当个体的特征明显不服从正态分布时,标准化表现的结果比较差。实际操作中,经常忽略数据的...
原创
2019-05-03 18:10:31 ·
415 阅读 ·
0 评论