由于数据集特征的量纲不同,所以需要归一化处理。常用的归一化方法:
1.最值归一化
这种方法适合用于分布有明显边界的情况。当存在个别特别大,或者特别小的数字出现的时候,这种归一化处理方式不好
2.均值方差归一化
适合用于没有明显分布边界,存在极端数据的情况
import numpy as np
import matplotlib.pyplot as plt
//均值方差归一化
x=np.random.randint(1,100,(50,2))
x[:,0]=(x
由于数据集特征的量纲不同,所以需要归一化处理。常用的归一化方法:
1.最值归一化
这种方法适合用于分布有明显边界的情况。当存在个别特别大,或者特别小的数字出现的时候,这种归一化处理方式不好
2.均值方差归一化
适合用于没有明显分布边界,存在极端数据的情况
import numpy as np
import matplotlib.pyplot as plt
//均值方差归一化
x=np.random.randint(1,100,(50,2))
x[:,0]=(x