贝叶斯优化决策树分类matlab代码数据为Excel分类数据集数据。
数据集划分为训练集、验证集、测试集,比例为8:1:1
模块化的结构: 代码分为清除命令窗口、数据加载、数据划分、参数设置、算法处理块、结果分析和绘图块等模块,使得代码更易于理解和维护。
数据预处理: 在数据划分之前,对数据进行了Z-score标准化处理,有助于提高模型的收敛速度和准确率。
模型评估: 使用了十折交叉验证的方法对模型进行评估,考虑到了模型的泛化能力,有助于更客观地评估模型的性能。
结果可视化: 代码中包含了对模型预测结果的可视化,包括了真实类别和预测类别的对比图以及测试集的混淆矩阵,有助于直观地了解模型的表现。
参数优化: 使用了贝叶斯优化来寻找决策树模型的最佳超参数,提高了模型的性能和泛化能力。
输出的定量结果如下:
十折验证准确率:0.9187
训练集准确率:1
验证集准确率:1
测试集准确率:0.86667
运行时长: 12.558
代码有详细中文介绍。
代码运行结果如下:
部分代码如下:
% 清除命令窗口、工作区数据、图形窗口、警告
clc;
clear;
close all;
warning off;
load('data.mat')
data1=readtable('分类数据集.xlsx'); %读取数据
data2=data1(:,2:end);
data=table2array(data1(:,2:end));
data_biao=data2.Properties.VariableNames; %数据特征的名称
A_data1=data;
data_biao1=data_biao;
data_select=A_data1;
feature_need_last=1:size(A_data1,2)-1;
%% 数据划分
x_feature_label=data_select(:,1:end-1); %x特征
y_feature_label=data_select(:,end); %y标签
index_label1=randperm(size(x_feature_label,1));
index_label=G_out_data.spilt_label_data; % 数据索引
if isempty(index_label)
index_label=index_label1;
end
spilt_ri=G_out_data.spilt_rio; %划分比例 训练集:验证集:测试集
train_num=round(spilt_ri(1)/(sum(spilt_ri))*size(x_feature_label,1)); %训练集个数
vaild_num=round((spilt_ri(1)+spilt_ri(2))/(sum(spilt_ri))*size(x_feature_label,1)); %验证集个数
%训练集,验证集,测试集
train_x_feature_label=x_feature_label(index_label(1:train_num),:);
train_y_feature_label=y_feature_label(index_label(1:train_num),:);
vaild_x_feature_label=x_feature_label(index_label(train_num+1:vaild_num),:);
vaild_y_feature_label=y_feature_label(index_label(train_num+1:vaild_num),:);
test_x_feature_label=x_feature_label(index_label(vaild_num+1:end),:);
test_y_feature_label=y_feature_label(index_label(vaild_num+1:end),:);