吃瓜教程Taks2 线性模型（第三章）

最新推荐文章于 2024-07-19 15:45:46 发布

无知之人_dream

最新推荐文章于 2024-07-19 15:45:46 发布

阅读量285

点赞数

文章标签：算法逻辑回归

本文链接：https://blog.csdn.net/qq_36630208/article/details/127960381

版权

机器学习专栏收录该内容

6 篇文章 1 订阅

订阅专栏

没有详细公式推到(如有需要，欢迎看南瓜书及其讲解视频）
可能存在谬误，请尽管批评

线性模型

线性模型，是指通过属性的线性组合来进行预测的函数，公式如下：(摘自西瓜书3.1)
$f(x) = w_1x_1 + w_2x_2 + . ...+w_dx_d + b (1)$
用向量表达则为
$f(x) = w^Tx + b(2)$
其中 $w=(w_1;w_2;...;w_d)$ , $w$ 和 $b$ 学得之后，模型就得以确定。

较为复杂的向量及其相关暂时摒弃，仅仅从二元一次方程 $y = w x + b$ 进行考虑，使用初中知识，此时 $x$ 是自变量， $y$ 为因变量，求其 $w$ 和 $b$ 。

在这样的考虑下， $w$ 和 $b$ 的求解非常容易，只需要使用两个已知的 $x$ 和 $y$ 就可以得到求得对应的 $w$ 和 $b$ (两点确定一条直线)。

但是，当点数大于两个，一条直线就不再百分之百的完美穿过每一个点，因此，我们要找到一条，和所有点的距离之和最近的一条直线。

以最常规的一个思路，我们可以计算当前直线与每个样本点之间的距离之和和，即公式表达为:
$Sum_{distance} = \sum_{i=1}^{m} \frac{|wx_i - y_i + b|}{\sqrt{1+k^2}} (3)$
其中，当前直线公式为 $y = w x + b$ ， $m$ 表示样本个数。那么最优化的直线公式，则可以视为是 $Sum_{distance}$ 最小时取得的 $w$ 和 $b$ 。

另外上方公式(3)所计算的是点到直线的正交距离，但是实际上的线性模型使用更多的是欧式距离，也就是均方误差，即对于一个自变量 $x$ ，计算实际的 $y$ 与预期 $y^{'}$ 之间的差值，则公式表达为:
$Sum_{distance} = \sum_{i=1}^{m} (y_i - wx_i -b)^2 (4)$
同理，依然期望求得 $Sum_{distance}$ 最小时的 $w$ 和 $b$ 。

注意：此刻我们的讨论，依然没有加入多元特征，我们仅考虑一个属性 $x$ ，也就是上方所表述的内容可以在二维平面中展示出来。(限于准备有限，没有配图)

那么，我们可以总结单个属性的线性模型，是针对每个自变量 $x$ ，都存在一个值 $y$ ，线性模型意图找到一条直线，可以使得针对于自变量 $x$ ，所求得的 $y^{'}$ 与 $y$ 的差值尽可能的小。

而机器学习所提到的线性模型，通常存在多个属性值，即： $x = \{x_1; x_2; ....; x_d\}$ ，但是其核心思想并无变化。

至此，我们可以说明确了一个基础的线性模型和基础线性模型索要求解的内容，再往下，是一些相关的简单讨论。

线性回归

在线性模型中，如果属性值存在多个，那么就是多元线性回归，但是这里为了理解，我们继续讨论的单个属性值的情况。

针对每一个出现的 $x$ ，我们想要得到一个尽可能接近真实 $y$ 的预期值 $y^{'}$ ，而如果 $y$ 的值是连续的，比如 $y$ 结果应该是 $[0, 1]$ 之间的任意实数，那么，我们就称其为回归任务，可以说，是回到真实值曲线上。

此时，上面使用上面的欧式距离公式就可以分析我们此刻结果的优劣性，公式如下所示：(摘自西瓜书(3.4))。
$(w^*, b^*) = arg min_{(w,b)} \sum_{i=1}^{m} (y_i - wx_i - b)^2 (5)$

那么如何求解最小化的 $w$ 和 $b$ 呢？注意，此时公式(4)中， $x$ 和 $y$ 均为已知，那么可以通过对未知变量 $w$ 和 $b$ 分别进行求导：
$\frac{\partial E_{w,b}}{\partial {w}} = 2(w \sum_{i=1}^{m} x_i^2 - \sum_{i=1}^{m}(y_i - b) x_i)) (6)$
$\frac{\partial E_{w,b}}{\partial {b}} = 2(mb - \sum_{i=1}^{m}(y_i - wx_i)) (7)$
求导所得，即为梯度。
其中 $E (w, b)$ 表示______，令公式 6 和公式 7 为 0 可以得到最优解的闭式解：
$\frac{ \sum_{i=1}^{m}y_i (x_i - x)}{ \sum_{i=1}^{m}x_i^2 - \frac{1}{m}( \sum_{i=1}^{m}x_i)^2}$
$\frac{1}{m}\sum_{i=1}^{m}(y_i - wx_i)^2$