读书笔记 在线流特征对不平衡数据的特征选择(Online feature selection for high-dimensional class-imbalanced data )

本文针对高维不平衡数据的在线特征选择问题,利用K-最近邻域粗糙集理论,提出新的在线特征选择框架。通过计算特征与决策属性间的依赖关系,确保小类特征不被忽略。实验结果显示,提出的K-OFSD算法优于传统和最新在线流特征选择方法。
摘要由CSDN通过智能技术生成

文献地址:Online feature selection for high-dimensional class-imbalanced data - ScienceDirect

1.本文写作的动机为:在真实的应用程序中,如欺诈检测和医疗诊断,数据是高维的,类是高度不平衡,在这种类不平衡的情况下,现有的在线特征选择算法通常会忽略在这些应用中可能很重要的小类,因此本文就对高维,不平衡数据的在线特征选择进行了研究。

流特征:

在线流的特征选择对象的数量是固定的,特征集是随时间增长的。在每个时间戳中,我们只能从流特征中得到一个特征,而整个特征空间是未知或不可访问的

2.本篇论中利用了K-最近邻域粗糙集这一理论来选择不平衡数据的特征。

下面是一个文献中的补充知识点

让我们以对象x3和特征集B = {f1, f2}和2个最近邻域为例,则kB(x3) = {x7, x2}。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值