令A是数值属性,具有n个观测值
。
最小—最大规范化对原始数据进行线性变换。假设和分别为属性A的最大值 和最小值 。最小—最大规范化通过计算:
最小—最大规范化保持原始数据值之间的联系,但是如果今后的输入实例落在A的原数据值域之外,则该方法将面临“越界”错误。
2、 z分数(z-score)规范化(或零均值规范化)
在z分数规范化中,属性A的值基于A的均值和标准差规范化。A的值 被规范化为 ,由以下公式计算:
当属性A的实际最小值和最大值未知,或者离群点左右了最小—最大规范化时,该方法是有效的。
3、小数定标规范化
小数定标规范化通过移动属性A的值的小数点位置进行规范化。小数点的移动位数依赖于A的最大绝对值。A的值 被规范化为 ,由下式计算:
1、 最小—最大规范化
最小—最大规范化对原始数据进行线性变换。假设和分别为属性A的最大值 和最小值 。最小—最大规范化通过计算:
把A的值 映射到 区间中 。
最小—最大规范化保持原始数据值之间的联系,但是如果今后的输入实例落在A的原数据值域之外,则该方法将面临“越界”错误。
2、 z分数(z-score)规范化(或零均值规范化)
在z分数规范化中,属性A的值基于A的均值和标准差规范化。A的值 被规范化为 ,由以下公式计算:
其中 和 分别为属性A的平均值和标准差。
当属性A的实际最小值和最大值未知,或者离群点左右了最小—最大规范化时,该方法是有效的。
3、小数定标规范化
小数定标规范化通过移动属性A的值的小数点位置进行规范化。小数点的移动位数依赖于A的最大绝对值。A的值 被规范化为 ,由下式计算:
其中,j是使得 的最小整数。