机器学习-线性模型数学推导和实现-Linear Model

最新推荐文章于 2024-08-05 20:31:58 发布

_Maru_

最新推荐文章于 2024-08-05 20:31:58 发布

阅读量657

点赞数 2

分类专栏：机器学习文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/qq_41411175/article/details/109150472

版权

本文深入探讨了线性模型的数学推导，包括简单的线性模型和加权线性模型，详细解释了如何在可逆和不可逆情况下求解权重。此外，还介绍了线性模型在实践中的应用，包括使用第三方库和自定义实现。

摘要由CSDN通过智能技术生成

1.线性模型的数学推导

1.1.简单的线性模型的数学推导

我们先考虑一个简单的线性模型，表达式如下：
$f(x) = w_1x+w_0$
其中， $w_1,w_0\in\R^1$ ，我们的损失函数定义为
$L(y',y^*)=\frac{1}{2N}(y'-y^*)^2$
其中， $y^{'}$ 是模型预测的标签， $y^*$ 是真实的标签， $N$ 是样本的个数。那么我们的 $E m p i r i c a l$ $R i s k$ 为
$\begin{aligned} \min_{f \in H}R_{emp}(f) &= \min_{w_0,w_1}\frac{1}{2N}\sum_{i=1}^N(f(x_i)-y_i) \\ &= \min_{w_0,w_1}\frac{1}{2N}\sum_{i=1}^N(w_0+w_1x-y_i) \end{aligned}$
然后令 $R_{emp}$ 对 $w_0和w_1$ 的偏导等于0，得到
$\begin{aligned} \hat{w}_1 &= \frac{\overline{xy} - \bar{x}\bar{y}} {\overline{(x^2)} - (\bar{x})^2} \\ \hat{w}_0 &= \bar{y} - \hat{w}_1\bar{x} \end{aligned}$
求得 $w_0和w_1$ 后，我们就可以带入 $f (x)$ 中，得到训练出来的模型为
$\hat{f}(x) = \hat{w}_0 + \hat{w}_1x$

1.2.一般化的推导

1.2.1.无加权线性模型的数学推导¹

一般化的线性模型的表达式为
$\begin{aligned} f(x) &= \sum_{j=1}^{M}w_j\phi_j(x) \\ &= w_1\phi_1(x)+w_2\phi_2(x)+\cdots+w_M\phi_M(x) \end{aligned}$
其中， $M$ 为数据集的特征的个数，也是 $X\_train$ 矩阵的列数。 $\phi_j(x)$ 为 $basis\ function$ 。同样的，我们令损失函数为 $mean\ square\ loss\ function$ ，那么我们的 $E m p i r i c a l$ $R i s k$ 为
$\begin{aligned} \min_{f\in H}R_{emp}(f) &= \min_{w\in R^M}R_{emp}(w) \\ &= \min_{w\in R^M}\frac{1}{2N}\sum_{i=1}^{N}[f(x_i) - y_i]^2 \\ &= \min_{w\in R^M}\frac{1}{2N}\sum_{i=1}^{N}\Big \{\sum_{j=1}^{M}w_j\phi_j(x_i) -y_i \Big \}^2 \\ &= \min_{w\in R^M}\frac{1}{2N}\sum_{i=1}^{N}\bigg \{ \left( \begin{array}{ccc} w_1 & w_2 & \cdots & w_M \end{array} \right) \left( \begin{array}{c} \phi_1(x_i) \\ \phi_2(x_i) \\ \vdots \\ \phi_M(x_i) \end{array} \right) - y_i \bigg \}^2 \\ &= \min_{w\in R^M}\frac{1}{2N}\sum_{i=1}^{N}[ W^T\phi(x_i) - y_i]^2 \\ &= \min_{w\in R^M}\frac{1}{2N} \left( \begin{array}{ccc} W^T\phi(x_1) - y_1 & W^T\phi(x_2) - y_2 & \cdots & W^T\phi(x_N) - y_N \end{array} \right) \left( \begin{array}{c} W^T\phi(x_1) - y_1 \\ W^T\phi(x_2) - y_2 \\ \vdots \\ W^T\phi(x_N) - y_N \end{array} \right) \\ &= \min_{w\in R^M}\frac{1}{2N}\Big[W^T \left( \begin{array}{ccc} \phi(x_1)& \phi(x_2) & \cdots & \phi(x_N) \end{array} \right) - \left( \begin{array}{ccc} y_1& y_2 & \cdots & y_N \end{array} \right)\Big] \left( \begin{array}{c} W^T\phi(x_1) - y_1 \\ W^T\phi(x_2) - y_2 \\ \vdots \\ W^T\phi(x_N) - y_N \end{array} \right) \\ &= \min_{w\in R^M}\frac{1}{2N}(W^T\Phi^T - y^T) (W^T\Phi^T - y^T)^T \\ &= \min_{w\in R^M}\frac{1}{2N}(W^T\Phi^T - y^T) (\Phi W - y) \\ &= \min_{w\in R^M}\frac{1}{2N}(W^T\Phi^T\Phi W - W^T\Phi^Ty - y^T\Phi W + y^Ty) \\ &= \min_{w\in R^M}\frac{1}{2N}(W^T\Phi^T\Phi W - 2W^T\Phi^Ty + y^Ty) \end{aligned}$

最低0.47元/天解锁文章

_Maru_

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
机器学习-线性模型数学推导和实现-Linear Model

简单的线性模型我们先考虑一个简单的线性模型，表达式如下：f(x)=w1x+w0f(x) = w_1x+w_0 f(x)=w1x+w0其中，w1,w0∈R1w_1,w_0\in\R^1w1,w0∈R1，我们的损失函数定义为L(y′,y∗)=12N(y′−y∗)2L(y',y^*)=\frac{1}{2N}(y'-y^*)^2L(y′,y∗)=2N1(y′−y∗)2其中，y′y'y′是模型预测的标签，y∗y^*y∗是真实的标签，NNN是样本的个数。那么我们的EmpiricalEmpi
复制链接

扫一扫