线性回归和贝叶斯的线性回归

最新推荐文章于 2021-06-30 16:17:52 发布

anarion

最新推荐文章于 2021-06-30 16:17:52 发布

阅读量1.4k

点赞数 10

分类专栏：统计学和机器学习文章标签：机器学习统计学概率论

本文链接：https://blog.csdn.net/weixin_42523849/article/details/106580556

版权

线性回归和贝叶斯的线性回归

本文源码地址：AnBlogs

问题是什么

这个h2标题令人疑惑，不就是线性回归么，高中就会啦。
$y=\theta^Tx+b$
或者也写成这样：
$y=\theta^Tx,x_0=1$
用一个 $x$ 的分量代表偏置项 $b$ ，为了方便表述，以下都使用这个记号。

线性回归的目标是，用线性的函数描述任何数据，使得误差最小。误差就是这样：
$L^{(i)}=||y^{(i)}-(\theta^Tx^{(i)})||_2^2$
这样好像理所当然。

这样直观的理解固然没什么毛病，为了理解更深入，必须有概率解释(probablistic perspective)做支撑。

统计学在做的事情是拟合概率密度函数，也就是当看见一个输入特征 $x$ 的时候，要得到预测值 $y$ 取值的概率分布，然后取最有可能的预测值输出。翻译成数学语言，就是要求 $p (y ∣ x)$ 。

对于线性回归问题来说，我们是在做这样的假设：对于一个特征 $x$ ，真实值 $y$ 应该和 $\theta^Tx$ 相去不远。这个描述很宽泛，有很多概率分布可能符合这个描述。对于连续取值的变量，我们喜欢正态分布：
$p(y|x)=\frac{1}{\sqrt{2\pi}\sigma}\exp(-\frac{(y-\theta^Tx)^2}{2\sigma^2})$
这是在假设要预测的 $y$ 服从一个以 $\theta^Tx$ 为均值、 $\sigma^2$ 为方差的正态分布。

这样一来，问题就不再是最小化误差，而是估计参数 $\theta,\sigma$ 。

估计过程

估计参数的过程应该怎样用概率描述呢？我们都知道模型训练的过程是给定一些样本数据 $D$ ，用这些来估计参数，说得更“数学”一点，就是对于给定的样本数据 $D$ ，参数的概率密度函数是什么？。对于上面的情况，就是要求：
$p(\theta,\sigma|D)$
这是后验(posteri)分布。展开成(贝叶斯)统计喜欢的形式：
$p(\theta,\sigma|D)\propto p(\theta,\sigma)p(D|\theta,\sigma)$
线性系数 $\theta$ 和 $\sigma$ 通常相互独立，或者说我们喜欢把它们假设成相互独立的：
$p(\theta,\sigma|D)\propto p(\theta)p(\sigma)p(D|\theta,\sigma)$
接下来的任务是计算似然(likelihood) $p(D|\theta,\sigma)$ 和假设先验(priori) $p(\theta),p(\sigma)$ 。

似然

表达似然

我们假设每个样本 $x^{(i)},y^{(i)}$ 之间都是相互独立的：
$p(D|\theta,\sigma)=\prod_ip(x^{(i)},y^{(i)}|\theta,\sigma)$
对于一行来说，这一行数据出现的概率：
$p(x^{(i)},y^{(i)}|\theta,\sigma)=\frac{1}{\sqrt{2\pi}\sigma}\exp(-\frac{(y^{(i)}-\theta^Tx^{(i)})^2}{2\sigma^2})$

最低0.47元/天解锁文章

anarion

关注

10
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
线性回归和贝叶斯的线性回归

线性回归和贝叶斯的线性回归问题是什么这个h2标题令人疑惑，不就是线性回归么，高中就会啦。y=θTx+by=\theta^Tx+by=θTx+b或者也写成这样：y=θTx,x0=1y=\theta^Tx,x_0=1y=θTx,x0=1用一个xxx的分量代表偏置项bbb，为了方便表述，以下都使用这个记号。线性回归的目标是，用线性的函数描述任何数据，使得误差最小。误差就是这样：L(i)=∣∣y(i)−(θTx(i))∣∣22L^{(i)}=||y^{(i)}-(\theta^Tx^{(
复制链接

扫一扫

专栏目录