GenSample算法初读+遗传算法初识

之前对于遗传算法的学习有些囫囵吞枣,知道大致思想是自然选择、优胜劣汰,通过大自然一代又一代的选择将适合的基因和物种逐渐保留下来,但是中间过程是如何实现的却并不清楚。
这次有缘读了加利福尼亚大学几位老师写的关于在不平衡数据集上进行过采样相关的论文,他们巧妙地将遗传算法用于过采样的过程中,生成了一种新采样算法GenSample,主要来处理四类少数样本(safe、borderline、rare、outliers)中极难处理的离群值(outliers),来有效的避免SMOTE算法和ADASYN算法中的一些缺陷,同时对Decision Tree、SMOTE、ADASYN和GenSample在9个数据集上的表现进行了6个方面的比较(Precision、Recall、F1 score、AUG、Accuracy、Geometric Mean),发现在Accuracy、F1 score和Precision上GenSample占据绝对优势,在recall和Geometric Mean上的大部分时间里要比其它方法表现更好。

论文:GenSample: A Genetic Algorithm for Oversampling in Imbalanced Datasets

在阅读这篇文章前,需要对遗传算法有个初步的了解,但是网络上一些博客介绍的较为模糊,并且会涉及到一系列难以下咽的专业名词,让人摸不着头脑。经过不断摸索之后,终于找到了一篇浅显易懂、清晰明了的讲解。
遗传算法:10分钟搞懂遗传算法(含源码)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值