规范化(标准化)数据的3种方法[R语言课程]

令A是数值属性,具有n个观测值  。      

    1、  最小—最大规范化
    最小—最大规范化对原始数据进行线性变换。假设和分别为属性A的最大值 和最小值 。最小—最大规范化通过计算:

    把A的值 映射到 区间中
    最小—最大规范化保持原始数据值之间的联系,但是如果今后的输入实例落在A的原数据值域之外,则该方法将面临“越界”错误。
 
    2、  z分数(z-score)规范化(或零均值规范化)
    在z分数规范化中,属性A的值基于A的均值和标准差规范化。A的值 被规范化为 ,由以下公式计算:

其中 分别为属性A的平均值和标准差。
    当属性A的实际最小值和最大值未知,或者离群点左右了最小—最大规范化时,该方法是有效的。
 
    3、小数定标规范化
    小数定标规范化通过移动属性A的值的小数点位置进行规范化。小数点的移动位数依赖于A的最大绝对值。A的值 被规范化为 ,由下式计算:

其中,j是使得 的最小整数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值