matlab生成多元回归仿真数据

最新推荐文章于 2023-01-07 22:10:05 发布

billy145533

最新推荐文章于 2023-01-07 22:10:05 发布

阅读量1.3k

点赞数

分类专栏：数据科学

本文链接：https://blog.csdn.net/billy145533/article/details/108972061

版权

数据科学专栏收录该内容

38 篇文章 8 订阅

订阅专栏

文章目录

前言

算法仿真需要生成多元回归的仿真数据，这里将代码简单地总结一下

仿真模型

$X\beta+\epsilon$
$y\in \mathbb{R}^{n\times 1},X\in \mathbb{R}^{n\times p},\beta\in \mathbb{R}^{n\times 1},\epsilon \in \mathbb{R}^{n\times 1}$
数据构造如下
$X\sim {N_p}({\mathbf{0}_p},{\Sigma })\\ y = X\beta+N(0,0.1)$

参数设置

生成60个样本，维度为6,协方差为 $\Sigma=diag(10,8,6,4,2,1)$ ,这样的得到的数据 $X$ 为满秩，系数可以直接用最小二乘法求解 $\hat{\beta}=(X^TX)^{-1}X^Ty$ 。

代码

代码主要调用了函数mvnrnd生成多元变量，第一个参数为均值向量，第二个参数为协方差矩阵，第三个参数是生成的样本数量。

n = 60;
p = 6;
cov = diag([10,8,6,4,2,1]);
X = mvnrnd(zeros(1,p),cov,n);
%经验协方差估计
hatcov = X'*X/(n-1)
beta = rand(p,1);
err = mvnrnd(0,0.1,n);
y = X*beta + err;
hatbeta = inv(X'*X)*X'*y;

%画图
plot([beta hatbeta],'linewidth',1.5);
h = legend(["$$\beta$$","$$\hat{\beta}$$"]);
set(h,'Interpreter','latex')
a=gca;
a.FontSize=20;
a.FontName='Helvetica';
set(gcf,'color','w');