特征选择基本思想与relieff算法

特征选择

如果特征参数不足,则很容易引发数据重叠的现象,所有分类器都将不起作用;如果特征参数太多,则可能会消耗大量时间和计算资源。特征选择可以通过消除冗余的特征来提高分类算法的准确性,并减少其计算复杂度。特征选择解决的实际问题是:当存在大量特征参数时,将对分类、回归等问题贡献度高的特征参数选择出来,而舍弃一些贡献度低的特征参数。因此,特征参数选择的困难在于其核心是解决复杂的组合优化问题。
2.3.1 故障特征优选准则
(1)去除无关特征,无关特征对模型的构建没有贡献且会增加模型的复杂度。
(2)去除冗余特征,特征参数之间存在相关性,如一个特征可由一个或多个特征推演出来,则该特征为冗余特征。或者该特征不会给模型提供新的信息,则该特征也为冗余特征,去除冗余特征可提高模型运行效率,使模型具有更好的性能。
2.3.2 故障特征优选数学模型
本文选取的故障特征优选算法为Relieff选择算法。Kononeill在1994年提出了该算法,Relieff算法能够直接对多分类问题中的参数进行选择,搜索当前样本的各种近邻,然后综合计算。Relief算法的原理是根据各个特征和类别的相关性赋予特征不同的权重,其本质是一个矢量,而特征参数的权重是各特征的统计量指标之和,权重小于某个阈值的特征将被移除。特征的权重越大,表示该特征对分类贡献度越高,反之,表示该特征对分类贡献度越低。选取对分类贡献度高的特征组成特征参数子集,即可优化选取特征。Relieff算法的主要过程如下:
在这里插入图片描述
在这里插入图片描述

(4)重复以上步骤m次,更新各特征的统计量指标。
可见,权值计算主要根据是:如果特征对分类有贡献,该特征在同类中的值应相近,而在不同分类中的值应不相近。
(5)最后可以根据统计量指标从大到小排序,选择排序靠前的特征得到合适的特征集合。
由于Relieff算法运算时间的增长与采样数和初始特征数量的增加呈线性关系,因此具有很高的运行效率。该算法不受数据类型的影响,全局搜索更优,运算效率更高。故本文在进行特征参数选取时,使用Relieff算法来减少特征参数数量,缩短模型训练时间,提高类别区分的准确率。

在这里插入图片描述

relieff算法的使用官方文档https://ww2.mathworks.cn/help/stats/relieff.html
其中详细介绍了relieff算法的使用,下图摘自官方文档
摘自官方文档

  • 5
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
ReliefF算法是一种特征选择算法,用于在高维特征样本中选取具有代表性的特征,从而降低样本特征维度。它是Relief算法的进阶版本,相比于Relief算法,ReliefF不仅可以用于二分类任务,还可以用于多分类任务和回归任务。\[1\] ReliefF算法的具体步骤如下: 1. 输入:训练集D,抽样次数m,特征权重阈值δ,最近邻样本个数k。 2. 输出:各个特征的特征权重T。 3. 初始化所有特征权重为0,T为空集。 4. 重复m次以下步骤: a. 从训练集D中随机选择一个样本R。 b. 从R的同类样本集中找到R的k个最近邻Hj(j=1,2,...,k),从每一个不同类样本集中找到k个最近邻Mj(C)。 c. 对于每个特征A(1到N),根据以下公式更新特征权重W(A): W(A) = W(A) - Σj=1k diff(A,R,Hj)/(mk) + ΣC∉class(R) \[p(C)/(1-p(class(R))) Σj=1k diff(A,R,Mj(C))\]/(mk) 5. 得到各特征的平均权重。 ReliefF算法通过计算特征与样本之间的距离差异来评估特征的重要性,权重越大表示特征的分类能力越强,权重越小表示特征的分类能力越弱。该算法的运行效率非常高,时间复杂度与抽样次数m和原始特征个数N成线性关系。\[2\]\[3\] #### 引用[.reference_title] - *1* [Matlab特征选择reliefF算法使用方法(分类与回归)](https://blog.csdn.net/weixin_44248258/article/details/122180369)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [特征选择之relief及reliefF算法](https://blog.csdn.net/littlely_ll/article/details/71614826)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值