光谱特征选择

光谱特征选择(谱特征选择)


Spectral feature selection可翻译为谱特征选择,之前的特征提取学习中陷入了光谱特征选择翻译的误区。

参考论文为"Spectral feature selection for supervised and unsupervised learning " 作者 为 Zheng Zhao ;Huan Liu

简介

这篇文章提出了一种基于"谱图理论"(spectral graph)的特征选取框架(Laplacian score 和 ReliefF 都属于这个框架的一个特殊情况
)。
这个框架的假设,是本着原数据是大爷的道理,假设一个好的特征应该与原来(训练)数据构成的图有着相似的结构。当然一个特征毕竟是有限的(比如用性别来区分人有没有钱),可是这个特征与训练数据的相关性越大,我们就觉得这个特征越好,越可取。

特征的一致性比较。目标概念由图形结构表示(由椭圆表示的集群)。不同的形状表示特征赋予的不同值。
特征的一致性比较。目标概念由图形结构表示(由椭圆表示的集群)。不同的形状表示特征赋予的不同值。

算法框架

  1. 构建数据的相似性矩阵S,以及由此基础推出的图的表示G,和W,D,L;
  2. 计算:在这里插入图片描述在这里插入图片描述
  3. 在这里插入图片描述排序;

算法推导

先用在这里插入图片描述来表示一个训练集,我们用在这里插入图片描述来表示m个特征,每个特征的对应的数据向量为在这里插入图片描述对于监督学习在这里插入图片描述用来表示每个数据所对应的类。

给定以上数据,可以由不同的规则来定义一个代表数据实例之前关系的实对称矩阵S,Sij表示两个实例之间的关系(距离),下面是两种常用的规则
对于无监督学习,可以用RBF核函数:
在这里插入图片描述
对于监督学习(l表示为同一类,nl表示l类中的个数):
在这里插入图片描述

所以我们可以通过X得到其无向图G(V,E),对于图G我们定义它的相邻矩阵(adjacency matrix)W,在这里插入图片描述.定义向量在这里插入图片描述

图G的degree matrix D为在这里插入图片描述
Laplacian matrix:在这里插入图片描述
Normalized Laplacian matrix:在这里插入图片描述
在这里插入图片描述
第一步衡量实例之间的相似性解决了,下一步就是求特征的权重(score)在这里插入图片描述

由性质2可以知道laplacian matrix 可以衡量一个向量各个数值之间的加权平方和,可以用来度量一个组数据之间的离散程度。这正是L矩阵有用的地方。

既然这样,因为有Wij,我们直接用在这里插入图片描述就可以算向量f与原数据之间的离散程度,这个式子越小,与元数据差别就越小。但是还要归一化一下由式子(5),所以有
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
当然这个间断的在这里插入图片描述并不能满足我们日益增长的需求,Smola 和Kondor用傅里叶变换对在这里插入图片描述进行了扩展,在这里插入图片描述
这里在这里插入图片描述是一个单调增函数,是用来惩罚高频分量

比如说,在这里插入图片描述可以有如下形式种特征打分函数
在这里插入图片描述

总结

Spectral feature selection 是一个方法框架。

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
东南亚位于我国倡导推进的“一带一路”海陆交汇地带,作为当今全球发展最为迅速的地区之一,近年来区域内生产总值实现了显著且稳定的增长。根据东盟主要经济体公布的最新数据,印度尼西亚2023年国内生产总值(GDP)增长5.05%;越南2023年经济增长5.05%;马来西亚2023年经济增速为3.7%;泰国2023年经济增长1.9%;新加坡2023年经济增长1.1%;柬埔寨2023年经济增速预计为5.6%。 东盟国家在“一带一路”沿线国家中的总体GDP经济规模、贸易总额与国外直接投资均为最大,因此有着举足轻重的地位和作用。当前,东盟与中国已互相成为双方最大的交易伙伴。中国-东盟贸易总额已从2013年的443亿元增长至 2023年合计超逾6.4万亿元,占中国外贸总值的15.4%。在过去20余年中,东盟国家不断在全球多变的格局里面临挑战并寻求机遇。2023东盟国家主要经济体受到国内消费、国外投资、货币政策、旅游业复苏、和大宗商品出口价企稳等方面的提振,经济显现出稳步增长态势和强韧性的潜能。 本调研报告旨在深度挖掘东南亚市场的增长潜力与发展机会,分析东南亚市场竞争态势、销售模式、客户偏好、整体市场营商环境,为国内企业出海开展业务提供客观参考意见。 本文核心内容: 市场空间:全球行业市场空间、东南亚市场发展空间。 竞争态势:全球份额,东南亚市场企业份额。 销售模式:东南亚市场销售模式、本地代理商 客户情况:东南亚本地客户及偏好分析 营商环境:东南亚营商环境分析 本文纳入的企业包括国外及印尼本土企业,以及相关上下游企业等,部分名单 QYResearch是全球知名的大型咨询公司,行业涵盖各高科技行业产业链细分市场,横跨如半导体产业链(半导体设备及零部件、半导体材料、集成电路、制造、封测、分立器件、传感器、光电器件)、光伏产业链(设备、硅料/硅片、电池片、组件、辅料支架、逆变器、电站终端)、新能源汽车产业链(动力电池及材料、电驱电控、汽车半导体/电子、整车、充电桩)、通信产业链(通信系统设备、终端设备、电子元器件、射频前端、光模块、4G/5G/6G、宽带、IoT、数字经济、AI)、先进材料产业链(金属材料、高分子材料、陶瓷材料、纳米材料等)、机械制造产业链(数控机床、工程机械、电气机械、3C自动化、工业机器人、激光、工控、无人机)、食品药品、医疗器械、农业等。邮箱:market@qyresearch.com
在Matlab中进行光谱特征选择可以使用多种方法,其中一种常用的方法是基于BP神经网络的特征选择算法[^1]。下面是一个简单的示例代码,演示了如何使用BP神经网络进行光谱特征选择: ```matlab % 假设你已经有了一个包含光谱数据的矩阵X,每一行代表一个样本,每一列代表一个特征 % 假设你已经有了一个包含类别标签的向量y,与X中的样本一一对应 % 设置神经网络的参数 hiddenLayerSize = 10; % 隐藏层神经元的数量 net = patternnet(hiddenLayerSize); % 创建一个BP神经网络 % 将数据划分为训练集和测试集 [trainInd,~,testInd] = dividerand(size(X,2),0.7,0,0.3); X_train = X(trainInd,:); y_train = y(trainInd,:); X_test = X(testInd,:); y_test = y(testInd,:); % 训练神经网络 net = train(net,X_train',y_train'); % 使用训练好的神经网络进行预测 y_pred = net(X_test'); % 计算预测准确率 accuracy = sum(y_pred == y_test') / length(y_test); % 获取特征权重 featureWeights = net.IW{1}; % 根据特征权重进行特征选择 selectedFeatures = find(featureWeights > 0.5); % 选择权重大于0.5的特征 % 输出选择特征 selectedFeatures ``` 这段代码首先创建了一个具有10个隐藏层神经元的BP神经网络。然后,将数据划分为训练集和测试集,并使用训练集训练神经网络。接下来,使用训练好的神经网络对测试集进行预测,并计算预测准确率。最后,根据神经网络的特征权重,选择权重大于0.5的特征作为最终的特征选择结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值