机器学习之SMOTE算法

 

了解决数据的非平衡 问题 2002 Chawla 提出了 SMOTE 算法,即合成少数
,它是基于随机 算法的一种改 方案。 是目前 理非平衡数据的常用手段,并
受到学 界和工 界的一致 同,接下来 简单 描述一下 算法的理 思想。
SMOTE 算法的基本思想就是 少数 类别样 行分析和模 ,并将人工模 的新 本添
加到数据集中, 而使原始数据中的 类别 不再 重失衡。 算法的模 拟过 程采用了 KNN
生成新 本的步 如下:
1 )采 近算法, 算出每个少数 类样 本的 K 个近
2 )从 K 个近 中随机挑 N 行随机 线 性插
3 )构造新的少数 类样 本。
4 )将新 本与原数据合成, 生新的 训练集。
 
 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值