python特征选择relieff图像特征优选_基于Relief特征选择算法的研究与应用

作者姓名导师姓名文献出处论文摘要伴随着当代科学技术的高速发展,人类已经进入了信息爆炸的时代。数据挖掘技术通过从大量数据中揭示出隐含的信息,将海量的高维数据转换为有用的信息和知识。特征选择是数据挖掘中的一个重要方向,特征选择算法通过剔除不相关或冗余的特征,从而达到减少特征个数,提高模型精度,减少运行时间的目的。从数据解释的层面上看,关键特征的提取还可以使模型得到简化,从而便于研究人员理解数据的产生。Relief是一种有效的特征选择算法。与ReliefF不同,Multi-Relief通过在多次随机抽取的两类样本上运行Relief算法将其由2类问题推广到多类问题。由于一次抽样只能随机抽取多类数据中的两类样本,可能造成所选样本的分布不具有代表性。为了有效融和每次抽样的结果,准确度量属性的的权重,本文提出了一种改进的Multi-Relief算法,核算法对每一次抽样产生的权重向量分组,将在组内出现频率小于一定程度的正权值摒弃,形成新的权重融合方法。在三组肝病代谢组学数据和三组公共数据中的实验表明,改进的Multi-Relief算法与Multi-Relief和ReliefF算法相比,性能得到了提高。本文还将ReliefF-RFE算法应用于生物数据的处理中。本文经过对基于SVM的ReliefF-RFE原理的分析以及研究,在本实验中用kNN分类器取代了SVM分类器。在两组肝病代谢组学数据以及六组高维的生物公共数据上的实验结果显示ReliefF-RFE算法与经典的ReliefF算法对比,所筛选的属性区分能力更强。本文从两个不同的角度对Relief族特征选择算法进行了讨论和分析,并通过十次十(?)交叉验证分类准确率结果证明了两种算法的有效性。论文目录关闭目录

摘要

Abstract

1 绪论

1.1 研究背景及意义

1.2 数据挖掘

1.3 本文主要工作

2 特征选择

2.1 过滤式特征选择算法

2.1.1 单变量过滤式特征选择算法

2.1.2 多变量过滤式特征选择算法

2.2 包裹式特征选择算法

2.3

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值