特征选择之最小冗余最大相关性(mRMR)(一种常用的特征选择方法是最大化特征与分类变量之间的相关度，就是选择与分类变量拥有最高相关度的前k个变量)

智能算法及其模型预测

已于 2024-03-05 09:37:36 修改

阅读量1.5k

点赞数 1

文章标签：深度学习 matlab

于 2022-11-30 09:25:48 首次发布

本文链接：https://blog.csdn.net/qq_43916303/article/details/128091856

版权

%% 清空环境变量
warning off % 关闭报警信息
close all % 关闭开启的图窗
clear % 清空变量
clc % 清空命令行

%% 导入数据
cartable = readtable("数据集.xlsx");
%% table数据转double
Tbl = rmmissing(cartable);
res=table2array(Tbl);
%% 数据分析
num_size = 0.75; % 训练集占数据集比例
outdim = 1; % 最后一列为输出
num_samples = size(res, 1); % 样本个数
res = res(randperm(num_samples), :); % 打乱数据集（不希望打乱时，注释该行）
num_train_s = round(num_size * num_samples); % 训练集样本个数
f_ = size(res, 2) - outdim; % 输入特征维度
flag_conusion = 1; % 标志位为1，打开混淆矩阵（要求2018版本及以上）
%% 划分训练集和测试集
P_train = res(1: num_train_s, 1: f_)';
T_train = res(1: num_train_s, f_ + 1: end)';
M = size(P_train, 2);

P_test = res(num_train_s + 1: end, 1: f_)';
T_test = res(num_train_s + 1: end, f_ + 1: end)';
N = size(P_test, 2);

%% 数据归一化
[p_train, ps_input] = mapminmax(P_train, 0, 1);
p_test = mapminmax('apply', P_test, ps_input);

[t_train, ps_output] = mapminmax(T_train, 0, 1);
t_test = mapminmax('apply', T_test, ps_output);
%%
[save_index,scores] = fscmrmr(cartable,"x__");%% 在使用时,这个x__表示的是你cartable变量中因变量表头的名称;
% 再更换数据以后,需要根据自己cartable变量中因变量的表头名称做粘贴复制来修改这个x__;
%% 输出选择特征的对应序号