【MATLAB第32期】【更新中】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理分类问题MATLAB代码实现

【MATLAB第32期】【更新中】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理分类问题MATLAB代码实现(持续更新)

本文敏感性分析主要分析分类问题(fisher、rf、arf、nca等)。

版本更新:

2023/8/2 增加基于拥挤距离和Pearson相关系数的IPCC方法(用SVM进行交叉验证分类预测评估)

clear all
warning('off','all');
tic;
load classdata  %导入数据
ContributeRate=0.9;
item=randperm(size(classdata,1));%数据打乱
classdata=classdata(item,:);% 数据打乱重组
xtrain=classdata(:,1:end-1);% 输入变量
ytrain=classdata(:,end);%输出标签
Nf=10;   %  选择特征数量 
[m,n]=size(xtrain); % m代表行  n代表列 

%拥挤前保存原始xdata
Xdatasave=xtrain;

%%0和1之间的归一化
xtrain= (xtrain-min(xtrain)) ./ (max(xtrain)-min(xtrain));

%%--------拥挤阶段
%计算特征的拥挤/相关距离
crowdingDistance = IPCC(Xdatasave, ytrain);
%%--------对特征值进行排名
[res,ind]=sort(crowdingDistance,'descend');
%%--------选择最重要的特征
indfeat=ind(1:Nf);
%%-----------评估准确性
kfold=5;           %  交叉验证K值
Acc = Eval(xtrain(:,indfeat),ytrain,kfold);   %分类器评估

在这里插入图片描述

在这里插入图片描述

正确率=100%
总特征变量数量 = 21
筛选的特征变量数量= 1
筛选的特征变量编号为: 16  19  18   2  17   4   7  20  10   5  14   6   1

一、降维方法(分类)

常见的降维方法:
常见的敏感性分析法:

*(一).全局敏感性分析(sobol、蒙特卡洛方法)


(二).非全局敏感性分析
1.变量筛选(Fisher算法、临近成分分析NCA、RF随机森林、ARF自适应随机森林)

二、案例数据

案例数据classdata 3998×22 ,前21列为变量,第22列为标签,案例采用2分类,即[1,2],多分类也满足。
在这里插入图片描述

三、实际应用

(1)Fisher算法

%% 1.Fisher
addpath('D:特征排序\Fisher')
load classdata
ContributeRate=0.9;
id=randperm(size(classdata,1));%数据打乱
classdata=classdata(id,:);% 数据打乱重组
xtrain=classdata(:,1:end-1);% 输入变量
ytrain=classdata(:,end);%输出标签
[W] = Fisher_Score(xtrain,ytrain) ;
plot2

在这里插入图片描述
在这里插入图片描述

(2)近邻成分分析NCA(用于分类)

%% (2)近邻成分分析NCA(用于分类)
addpath('D:\特征排序\NCA')
load classdata
ContributeRate=0.9;
[xx,mdl]=myfscnca(xtrain,ytrain,0.9);
xnca=classdata(:,xx);

在这里插入图片描述
在这里插入图片描述

(3)临近成分分析NCA

%% (3)近邻成分分析NCA
addpath('D:\特征排序\NCA')
ContributeRate=0.9;
xtrain =data(:,1:end-1);
ytrain =data(:,end);
[xx,mdl]=myfsrnca(xtrain,ytrain,0.9);
xnca=data(:,xx);

(4)随机森林RF

%% (3)随机森林RF
addpath('D:\特征排序\RF')
load classdata
ContributeRate=0.9;
[XT,RFModel,w]= mycrf(classdata,ContributeRate);
xrf=classdata(:,XT);

在这里插入图片描述在这里插入图片描述

(5)自适应随机森林ARF

%% (4)自适应随机森林ARF
addpath('D:\小论文文件包最终版\基坑与算法文献\副业\特征排序\ARF')
load classdata
ContributeRate=0.9;
params.RFLeaf=[5,10,20,50,100,200,500]; %RFLeaf定义初始的叶子节点个数,这里设置了从5到500。
params.Maxepoch=500; % 选择叶子节点个数对应的最大训练步数
[XT,RFModel,w,params]= mycarf(classdata,ContributeRate,params);
xarf=classdata(:,XT);

在这里插入图片描述

nTree = 20;nLeaf = 5;
在这里插入图片描述
在这里插入图片描述

四、代码获取

私信回复‘32’即可获取下载链接。

  • 3
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 9
    评论
### 回答1: MATLAB Morris全局敏感性分析方法是一种用于评估模型输入参数对输出结果的影响程度的方法。它通过将参数值修改为不同的水平,并记录输出结果的变化来分析参数的重要性。 该方法基于Morris采样算法,该算法通过扰动输入参数的取值来快速估计敏感性。在MATLAB,通过使用Global Sensitivity Analysis Toolbox(全局敏感性分析工具箱)的函数来实施Morris全局敏感性分析。 这个方法有以下几个特点: 1. 不要求模型的全局数学函数形式或概率分布假设,因此适用于各种复杂模型。 2. 该方法能够同时处理连续变量和离散变量。 3. 使用Morris采样算法,可以在较少的采样次数下得到较为准确的敏感性指标。 实施Morris全局敏感性分析的步骤如下: 1. 选择感兴趣的输入参数和输入范围。 2. 根据选择的参数范围,选择合适的参数取样点数和取样水平数,令参数个数为p,取样点数为n,取样水平数为r。 3. 利用Morris采样算法生成取样点,并结合模型运行,记录相应输出结果。 4. 通过对取样点间距的排序分析参数对模型输出结果的主要影响。 5. 根据Morris全局敏感性指标,计算每个参数的敏感性,指标越大表示该参数对输出结果的影响越大。 通过Morris全局敏感性分析,可以帮助研究人员确定模型最重要的参数,从而提供有效的决策依据。此外,MATLAB还提供了其他一些全局敏感性分析方法,如Sobol分析和FAST分析,用于更全面地评估参数对模型输出的敏感性。 ### 回答2: Morris全局敏感性分析是一种常用于评估模型的输入变量对输出结果的影响程度的方法。它通过对输入变量进行随机扰动,观察输出结果的变化,从而判断不同输入变量的敏感性程度。 Matlab提供了用于执行Morris全局敏感性分析的工具箱,可以帮助研究人员进行这种分析。这个工具箱提供了一系列函数,可以根据用户给定的输入参数范围和分辨率,生成一组随机采样点,并计算相应的模型输出。 该工具箱最重要的函数是"Morris"函数,它可以执行Morris分析并生成相应的结果。这个函数需要输入用户自定义的模型函数,以及模型的输入参数范围、分辨率等信息。在执行分析后,"Morris"函数将返回包含敏感性指数和其它统计数据的结果结构体。 结果结构体包含几个重要的字段,包括元素敏感性(ElementaryEffect)、总体敏感性(TotalEffect)和标准差等。元素敏感性表示每个输入参数对输出结果的影响程度,总体敏感性则是所有输入参数的元素敏感性的平均值。标准差是用于评估结果的稳定性和可靠性的指标。 使用Matlab进行Morris全局敏感性分析,研究人员可以得到各个输入参数的敏感性指数,从而判断它们对模型输出结果的重要性。这些指数可以帮助研究人员识别关键的输入参数,优化模型的设计和参数选择,提高模型的可靠性和准确性。 ### 回答3: MATLAB Morris全局敏感性分析方法是一种用于评估输入参数对系统输出结果的敏感性的统计方法。它基于Morris采样设计和元分析,适用于单一输出的低维和等维度的非线性、非光滑和复杂模型。 该方法通过随机地变化输入参数值,观察系统的输出结果,从而量化每个输入参数对系统输出的影响程度。具体步骤如下: 1. 设计采样:首先,根据输入参数的分布情况,生成一组随机采样点。采样点的数量通常较小,以降低计算成本。 2. 构建采样路径:对于每个采样点,按照某种规则选择相邻的参数值进行变化。采样路径主要用于评估参数的一阶效应。 3. 确定输出:根据采样路径和参数值,计算系统的输出结果。输出可以是某个目标函数的取值,也可以是系统的响应曲线。 4. 分析敏感性:使用Morris敏感度指标来评估参数的敏感性。Morris敏感度指标包括一阶和总方差敏感度,分别反映参数的线性和非线性输入效应。 5. 元分析:对于较小的采样点数量,重复多次采样并计算敏感度指标的均值和置信区间,以提高可靠性。 MATLAB Morris全局敏感性分析方法的优点是简化了参数敏感性分析的复杂度和计算工作量,适用于等维度的模型。然而,由于采样点数量较少,可能会存在评估结果的不确定性。因此,在实际应用,需要结合其他敏感性分析方法进行综合评估,以获得更准确的结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

随风飘摇的土木狗

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值