机器学习:特征选择之 Filter :Relief方法

Relief特征选择方法是一种filter方法。filter方法的过程如下:
这里写图片描述
下面结合论文[1]谈下Relief算法。该算法的流程如下图:
这里写图片描述
其中第一个参数S是训练集,第二个m是S的大小,第三个t为相关判定阈值,0<=t<=1.
1、Relief认为什么样的特征是相关的那,换句话说什么样的特征对类别具有区分性那?
以二分类为例,如果一个特征对区分0/1是有帮助的,那么该特征的分布应该不是随机的。举个不恰当的例子,假设特征f1在类别1中出现频率很大,而在类别0中却很少出现,那么f1对分类是具有贡献的。
回到Relief算法,对实例xi中的某一特征fi而言,xi中的fi应该与Near-hit的fi相近,而与Near-miss中的fi相远。[1]从统计学的角度详细说明了Relief的特征相关性选择依据。
2、Relief的优点与不足
优点:Relief对噪音不敏感,训练速度比穷举搜索Focus[2]特征选择要快。
缺点:Relief不能处理特征冗余,数据稀疏性性对降低算法的性能

最近较忙,简单介绍下,具体参考论文[1]

[1]The Feature Selection Problem:Traditional Methods and a New Algorithm ,Kenji Kira
[2] Science Society.[Almuallim & Dietterich 19911 Almuallim, H. &Dietterich, T. G., Learning With Many Irrelevant Features, Proceedings of the Ninth National

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值