贝叶斯回归

最新推荐文章于 2024-02-24 19:33:05 发布

我是你老汉c

最新推荐文章于 2024-02-24 19:33:05 发布

阅读量851

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/qq_39232194/article/details/105318261

版权

贝叶斯回归

回归模型

假设Data: ${\{(x_1,y_1),...(x_n,y_n)\}}$

对于 $X={(x_1,x_2,...x_n)}$ ,每个 $x_i$ 有p个特征，就是一个矩阵 $\begin{bmatrix}x_{11} & x_{12} & ... & x_{1p}\\ x_{21} & x_{22} & ... & x_{2p}\\ ... & ... & ... & ... \\x_{n1} & x_{n2} & ... & x_{np} \end{bmatrix}$

,Y= ${\begin{bmatrix} y_1 \\ y_2 \\... \\y_n \end{bmatrix}}$

对于线性回归模型来说，我们要找到一组参数矩阵 $W$ 使得
$\left \{ \begin{array}{c} f(x)=W^TX \\ y=f(x)+\epsilon \\ \end{array}\right.$
其中一般假设 $\epsilon \sim N(0,\sigma^2)$

贝叶斯方法有两个步骤，一个是Inference，一个是predict

Inference求参数w，predict求新的测试机数据 ${x^*}$ 对应的 $y^*$

1. Inference

$p(W|Data)=p(W|X,Y)=\frac {p(W,Y|X)} {p(Y|X)}=\frac {p(Y|W,X)P(W)} {\int p(Y|W,X)P(W)dW}$

其中 ${p(W,Y|X)=p(Y|W,X)P(W|X)}$ 但由于W和X相互独立，所以 $P (W ∣ X) = p (W)$

然后因为 $p (Y ∣ W, X)$ 是一个联合概率密度嘛，就是似然，故
$p(Y|W,X)=\prod_{i=1}^{n} p(y_i|W,x_i)$
由 $\epsilon \sim N(0,\sigma^2)$ ，故 $p(y_i|x_i,w) \sim N(W^Tx_i,\sigma^2)$ ,然后因为多个正态相乘还是正态，可得上式属于正态分布

现在一般会先假设一个先验令 $\sim N(0,\Sigma)}$ ,

由 $\propto p(Y|W,X)p(W)$ ，高斯分布又属于指数族分布，指数族分布都有的共轭的性质，所以可知 $p (W ∣ D a t a)$ 也是一个高斯分布。高斯的共轭是指一个分布的先验和似然概率都是高斯分布，那他的后验也是高斯分布。

现在就可以我们最终Inference的一个模型 $p (W ∣ D a t a ）$ 是一个高斯分布，现在只需要求出这个高斯分布的均值 $\mu_w$ 和方差 $\Sigma_w$ ，

下面就是一波推导
$p(Y|X,W)=\prod_{i=1}^{n} \frac {1}{\sqrt{2\pi}\sigma} exp\{- \frac {1}{2 \sigma^2 }(y_i-W^Tx_i)^2\} \\ =\frac {1}{{2\pi}^{\frac {n}{2}}\sigma^n} exp\{- \frac {1}{2 \sigma^2 }\sum_{i=1}^{n}(y_i-W^Tx_i)^2\} \\=\frac {1}{{2\pi}^{\frac {n}{2}}\sigma^n} exp\{-\frac {1}{2} (Y-XW)^T\sigma^{-2}I(Y-XW)\}$
其中I为单位矩阵，故 $\sim N(XW，\sigma^{-2}I)$

所以 $\propto N(XW，\sigma^{-2}I)N(0,\Sigma)$

,同样也是高斯分布相乘，这里省略步骤，比较复杂，直接给出答案，
$p(W|Data)=N(\mu_w,\Sigma_w),\\ \mu_w=\sigma^{-2}A^{-1}X^TY,\\ \sigma_w=A^{-1}\\，其中A=\sigma^{-2}X^TX +\Sigma^{-1}$

2.predict

现在已知 $p(w|Data)=N(\mu_w,\Sigma_w)$ ，且 $\mu_w,\Sigma_w$ 已知，

故对于新的测试 $x^*$ ,套用回归模型 $f(x^*)=x^*{^T}W$ ， $x^*$ 是常数，常数乘高斯分布，故有 $f(x^*)=N(x^*{^T}u_w,x^*{^T}\Sigma_wx^*)$ ，

所以 $y^*=f(x)+\epsilon=N(x^*{^T}u_w,x^*{^T}\Sigma_wx^*+\sigma^2)$

代码实现

哎，还不想搞

总结

贝叶斯回归是典型的贝叶斯派方法。考虑将参数w看成随机变量，进行建模，这种方法和之前了解的线性回归不太一样，之前的线性回归是没有概率的，而贝叶斯将参数看成随机变量，这种方法，也使得最终预测的y也是一个分布，就很模糊理论了，直觉上很吊的样子

我是你老汉c

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
贝叶斯回归

贝叶斯回归回归模型假设Data:{(x1,y1),...(xn,yn)}{\{(x_1,y_1),...(x_n,y_n)\}}{(x1,y1),...(xn,yn)}对于X=(x1,x2,...xn)X={(x_1,x_2,...x_n)}X=(x1,x2,...xn),每个xix_ixi有p个特征，就是一个矩阵[x11x12...x1px21x22...x2p.........
复制链接

扫一扫