西瓜书——一元线性回归（二）

最新推荐文章于 2024-09-16 16:56:48 发布

风之谷7888548

最新推荐文章于 2024-09-16 16:56:48 发布

阅读量182

点赞数 2

文章标签：机器学习

本文链接：https://blog.csdn.net/baidu_38356450/article/details/103377820

版权

这篇博客将补充解释在一元线性回归问题中如何向量化的问题。

为何要向量化

在上篇博客中，我们求解了 $w$ 和 $b$ 的表达式，我们会发现， $b$ 的表达式尚属于简单的形式，但是 $w$ 的表达式却含有太多的求和符号了，当我们用Python代码去实现算法的时候就需要使用多个 $f o r$ 循环去遍历，这将大大提高算法的复杂度，降低算法的性能。但是Python有个numpy的库可以用来做矩阵运算，库里的算法也进行了调优，所以我们就尽可能使用向量的形式去表示 $w$ ，两个向量相乘就是一个求和。

向量化的准备步骤

$w=\frac{\sum_{i=1}^{m}y_i(x_i-\widetilde{x})}{\sum_{i=1}^{m}x_i^2- \frac{1}{m}(\sum_{i=1}^{m}x_i)^2}$
恒等变形，
$w=\frac{\sum_{i=1}^{m}y_i(x_i-\widetilde{x})}{\sum_{i=1}^{m}x_i^2- \sum_{i=1}^{m} \widetilde{x}x_i}$
$w=\frac{\sum_{i=1}^{m}y_i(x_i-\widetilde{x})}{\sum_{i=1}^{m}(x_i^2- \widetilde{x}x_i)}$
$w=\frac{\sum_{i=1}^{m}(y_ix_i-\widetilde{x}y_i)}{\sum_{i=1}^{m}(x_i^2- \widetilde{x}x_i)}$
此时 $w$ 的分子分母都只有一个求和符号了，也就是说，分子分母都可以变成两个向量相乘的形式了，但是用哪两个向量来表示呢？

向量化

通过观察分子分母，我们可以对里面的一些项做出恒等变形。
$\sum_{i=1}^{m} \widetilde{x}y_i=\frac{1}{m}\sum_{i=1}^{m}x_i\sum_{i=1}^{m}y_i=\sum_{i=1}^{m}x_i \widetilde{y}$
$\sum_{i=1}^{m} \widetilde{x}y_i=\widetilde{x} \cdot\frac{1}{m} \cdot m\sum_{i=1}^{m}y_i=m \cdot \widetilde{x}\cdot \widetilde{y}=\sum_{i=1}^{m} \widetilde{x}\cdot \widetilde{y}$
$\sum_{i=1}^{m}\widetilde{x} \cdot x_i=\widetilde{x} \cdot\frac{1}{m} \cdot m\sum_{i=1}^{m}x_i = \sum_{i=1}^{m}\widetilde{x} ^2$

再将 $w$ 进行“加一项减一项”,
$w=\frac{\sum_{i=1}^{m}(y_ix_i-\widetilde{x}y_i-\widetilde{x}y_i+\widetilde{x}y_i)} {\sum_{i=1}^{m}(x_i^2- \widetilde{x}x_i-\widetilde{x}x_i+\widetilde{x}x_i)}$
再将上面已变型的项代入 $w$ 中进行恒等变形，
$w=\frac{\sum_{i=1}^{m}(y_ix_i-\widetilde{x}y_i-\widetilde{x}y_i+\widetilde{x}y_i)} {\sum_{i=1}^{m}(x_i-\widetilde{x})^2}$
$w=\frac{\sum_{i=1}^{m}(x_i-\widetilde{x})(y_i-\widetilde{y})} {\sum_{i=1}^{m}(x_i-\widetilde{x})^2}$
令向量 $X=(x_1-\widetilde{x},x_2-\widetilde{x},...,x_i-\widetilde{x})^T$
$Y=(y_1-\widetilde{y}, y_2-\widetilde{y},...,y_i-\widetilde{y})^T$
所以 $w=\frac{X^TY}{X^TX}$
向量化结束！