1.8 KNN算法学习——数据归一化处理解决量纲不同的问题

在KNN算法中,由于特征的量纲不同可能导致分类结果被某个数量级较大的特征主导。为解决此问题,需要进行数据归一化。常见的归一化方法包括最值归一化和均值-方差归一化。最值归一化将数据映射到0~1之间,适合受极端值影响大的情况;均值-方差归一化则使数据归一到均值0、方差1的分布,确保各特征平等参与决策。
摘要由CSDN通过智能技术生成

多个特征时,其中某个特征数量级较大,其他较小时最后的分类结果会被该特征所主导,而弱化了其他特征的影响,这是因为各个特征的量纲不同所致,需要将数据进行归一化

解决方案:将所有的数据映射到同一尺度

#归一化方式一:最值归一化

把所有的数据映射到0~1之间


适用于有明显的边界,受outlier极端值影响较大,比如收入的分布

#归一化方式二:均值-方差归一化

把所有数据归一到均值为0方差为1的分布中

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值