一、原理
数据标准化(Normalization):将数据按照一定比例进行缩放,使其落入到一个特定的小区间。
数据标准化的类别:
- Min-Max标准化
- Z-Score标准化(Standard Score,标准分数)
- 小数定标(Decimal scaling)标准化
- 均值归一化
- 向量归一化
- 指数转换
1、Min-Max标准化
Min-Max标准化,指对原始数据进行线性变换,将值映射到[0,1]之间。
公式:
式中,x为原始数据的数据,为原始数据的最小值,为原始数据的最大值。
2、Z-Score标准化
又称为Standard Score(标准分数),指基于原始数据的均值(mean)和标准差(standard deviation)来进行数据的标准化。
公式:
式中,x为原始数据的数据,为原始数据的均值,