【Matlab】PLS偏最小二乘法时序预测算法（附代码）

置顶千源万码

已于 2024-07-12 15:55:57 修改

阅读量415

点赞数 3

分类专栏： Matlab 文章标签：算法 matlab 最小二乘法

于 2024-07-10 18:08:00 首次发布

本文链接：https://blog.csdn.net/vvoennvv/article/details/140331044

版权

Matlab 专栏收录该内容

50 篇文章 7 订阅

订阅专栏

资源下载：https://download.csdn.net/download/vvoennvv/89530512

资源合集：https://download.csdn.net/download/vvoennvv/88700669

一，概述

偏最小二乘法是一种新型的多元统计数据分析方法，于1983年由S.Wold和C.Albano等人首次提出。偏最小二乘法实现了，在一个算法下，可以同时实现回归建模（多元线性回归）、数据结构简化（主成分分析）以及两组变量之间的相关性分析（典型相关分析）。
PCA方法虽解决了自变量共线性的问题，但是并没有考虑自变量主元对于因变量变化的解释作用。所以删除的次要主元有可能包含对回归有益的信息，而保留的主元有可能会夹杂一些对回归模型输出无益的噪声。
PLS方法，通过将自变量和因变量的高维数据空间投影到相应的低维空间，分别得到自变量和因变量的相互正交的特征向量，再建立自变量和因变量的特征向量间的一元线性回归关系。不仅可以克服共线性问题，它在选取特征向量时强调自变量对因变量的解释和预测作用，去除了对回归无益噪声的影响，使模型包含最少的变量数。

二，代码

代码中文注释非常清晰，按照示例数据修改格式，替换数据集即可运行，数据集为excel。

部分代码如下：

%%  清空环境变量
warning off             % 关闭报警信息
close all               % 关闭开启的图窗
clear                   % 清空变量
clc                     % 清空命令行

%%  导入数据（时间序列的单列数据）
result = xlsread('数据集.xlsx');

%%  数据分析
num_samples = length(result);  % 样本个数 
kim = 15;                      % 延时步长（kim个历史数据作为自变量）
zim =  1;                      % 跨zim个时间点进行预测

%%  划分数据集
for i = 1: num_samples - kim - zim + 1
    res(i, :) = [reshape(result(i: i + kim - 1), 1, kim), result(i + kim + zim - 1)];
end
%%  数据集分析
outdim = 1;                                  % 最后一列为输出
num_size = 0.7;                              % 训练集占数据集比例
num_train_s = round(num_size * num_samples); % 训练集样本个数
f_ = size(res, 2) - outdim;                  % 输入特征维度

%%  划分训练集和测试集
% temp = 1: 1: 922;
% 
% P_train = res(temp(1: 700), 1: 15)';
% T_train = res(temp(1: 700), 16)';
% M = size(P_train, 2);
% 
% P_test = res(temp(701: end), 1: 15)';
% T_test = res(temp(701: end), 16)';
% N = size(P_test, 2);
P_train = res(1: num_train_s, 1: f_)';
T_train = res(1: num_train_s, f_ + 1: end)';
M = size(P_train, 2);

P_test = res(num_train_s + 1: end, 1: f_)';
T_test = res(num_train_s + 1: end, f_ + 1: end)';
N = size(P_test, 2);

%%  数据归一化
[p_train, ps_input] = mapminmax(P_train, 0, 1);
p_test = mapminmax('apply', P_test, ps_input);

[t_train, ps_output] = mapminmax(T_train, 0, 1);
t_test = mapminmax('apply', T_test, ps_output);

%%  转置以适应模型
p_train = p_train'; p_test = p_test';
t_train = t_train'; t_test = t_test';

%%  创建模型
k = 12;     % 保留主成分个数
[Xloadings, Yloadings, Xscores, Yscores, betaPLS, PLSPctVar, MSE, stats] = plsregress(p_train, t_train, k);

......