規范化(標准化)數據的3種方法

http://blog.csdn.net/Meoop/article/details/40931731


令A是數值屬性,具有n個觀測值 。      

    1、  最小—最大規范化
    最小—最大規范化對原始數據進行線性變換。假設和分別為屬性A的最大值 和最小值 。最小—最大規范化通過計算:

    把A的值 映射到 區間中
    最小—最大規范化保持原始數據值之間的聯系,但是如果今後的輸入實例落在A的原數據值域之外,則該方法將面臨「越界」錯誤。
 
    2、  z分數(z-score)規范化(或零均值規范化)
    在z分數規范化中,屬性A的值基於A的均值和標准差規范化。A的值 被規范化為 ,由以下公式計算:

其中 分別為屬性A的平均值和標准差。
    當屬性A的實際最小值和最大值未知,或者離群點左右了最小—最大規范化時,該方法是有效的。
 
    3、小數定標規范化
    小數定標規范化通過移動屬性A的值的小數點位置進行規范化。小數點的移動位數依賴於A的最大絕對值。A的值 被規范化為 ,由下式計算:

其中,j是使得 的最小整數。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值