贝叶斯优化决策树回归matlab代码
数据为Excel股票预测数据。
数据集划分为训练集、验证集、测试集,比例为8:1:1
代码结构: 代码采用了模块化的结构,清晰地划分了数据处理、参数设置、算法处理块等部分,易于理解和维护。
数据处理: 在数据处理部分,对数据进行了加载、划分、标准化等操作,保证了数据的质量和一致性。数据的划分按照训练集、验证集和测试集的比例进行,有利于后续模型的评估和泛化能力的检验。
模型训练: 采用了决策树回归模型,并使用了自动优化超参数的方法进行模型训练。这有助于提高模型的性能和泛化能力,同时减少了手动调参的工作量。
结果可视化: 最后,通过绘制训练集、验证集和测试集的真实标签与预测标签的曲线对比图,直观地展示了模型的拟合效果和预测能力。
输出多个评价指标:
平均绝对误差(MAE)
均方根误差(RMSE)
均方误差(MSE)
均方根误差(RMSE)
R方系数(R2)
代码有详细中文介绍。
代码运行结果如下:
部分代码:
% 清除命令窗口、工作区数据、图形窗口、警告
clc;
clear;
close all;
warning off;
% 加载数据
load('data.mat');
data1 = readtable('股票价格.xlsx'); % 读取数据
data2=data1(:,2:end);
data=table2array(data1(:,2:end));
data_biao=data2.Properties.VariableNames; %数据特征的名称
str_label=0; %标记输出是否字符类型
A_data1=data;
data_biao1=data_biao;
data_select=A_data1;
feature_need_last=1:size(A_data1,2)-1;
%% 数据划分
x_feature_label=data_select(:,1:end-1); %x特征
y_feature_label=data_select(:,end); %y标签
index_label1=1:(size(x_feature_label,1));
index_label=G_out_data.spilt_label_data; % 数据索引
if isempty(index_label)
index_label=index_label1;
end
spilt_ri=G_out_data.spilt_rio; %划分比例 训练集:验证集:测试集
train_num=round(spilt_ri(1)/(sum(spilt_ri))*size(x_feature_label,1)); %训练集个数
vaild_num=round((spilt_ri(1)+spilt_ri(2))/(sum(spilt_ri))*size(x_feature_label,1)); %验证集个数
%训练集,验证集,测试集
train_x_feature_label=x_feature_label(index_label(1:train_num),:);
train_y_feature_label=y_feature_label(index_label(1:train_num),:);
vaild_x_feature_label=x_feature_label(index_label(train_num+1:vaild_num),:);
vaild_y_feature_label=y_feature_label(index_label(train_num+1:vaild_num),:);
test_x_feature_label=x_feature_label(index_label(vaild_num+1:end),:);
test_y_feature_label=y_feature_label(index_label(vaild_num+1:end),:);