机器学习task1：线性回归

最新推荐文章于 2024-07-21 22:04:22 发布

运气超好的锦鲤。

最新推荐文章于 2024-07-21 22:04:22 发布

阅读量146

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/qq_43566596/article/details/105672646

版权

1.线性回归的模型函数

假设有 $n$ 个样本，每个样本对应于 $d$ 个维度和一个输出 $y$ ，构成数据集 ${(x_1,y_1),(x_2,y_2),...,(x_n,y_n)\}$ 。若 $y$ 是连续的，我们希望 $x$ 与 $y$ 的关系能够用下面这种形式描述：
$\begin{aligned} f(x) &= \theta_0 + \theta_1x_1 + \theta_2x_2 + ... + \theta_dx_d \\ &= \sum_{i=0}^{d}\theta_ix_i \\ \end{aligned}$
这是一个线性回归模型。
需要选取 $\theta$ 的值，使得 $f (x)$ 尽可能接近y的值。通常采用均方误差作为回归中常用的性能度量，即：
$J(\theta)=\frac{1}{2}\sum_{j=1}^{n}(h_{\theta}(x^{(i)})-y^{(i)})^2$

也就是说，我们的目的是选择 $\theta$ 使得均方误差最小化。

2.线性回归的代价函数与目标函数

损失函数(Loss Function)：度量单样本预测的错误程度，损失函数值越小，模型就越好。
代价函数(Cost Function)：度量全部样本集的平均误差。
目标函数(Object Function)：代价函数和正则化函数，最终要优化的函数。正则化是为了防止过拟合。

3.线性回归的几种优化方法

梯度下降法

$\theta$ 迭代公式：
$\theta_j = \theta_j + \alpha\sum_{i=1}^{n}(y^{(i)}-f_\theta(x)^{(i)})x_j^{(i)}$
下标j表示第j个参数，上标i表示第i个样本。
向量形式表示为
$\theta= \theta+ \alpha\sum_{i=1}^{n}(y^{(i)}-f_\theta(x)^{(i)})x^{(i)}$

上式是对应所有的训练样本，称为批梯度下降法。
每一次对单个样本进行迭代更新成为随机梯度下降法，迭代公式为
$\theta = \theta + \alpha(y^{(i)}-f_\theta(x)^{(i)})x^{(i)}$
批量梯度下降—最小化所有训练样本的损失函数，使得最终求解的是全局的最优解，即求解的参数是使得风险函数最小，但是对于大规模样本问题效率低下。

随机梯度下降—最小化每条样本的损失函数，虽然不是每次迭代得到的损失函数都向着全局最优方向，但是大的整体的方向是向全局最优解的，最终的结果往往是在全局最优解附近，适用于大规模训练样本情况。

最小二乘法

$\theta$ 迭代公式：
$\theta = (X^TX)^{(-1)}X^TY$

牛顿法

$\theta$ 迭代公式：
$\theta =\theta-\frac{l'(\theta)}{l''(\theta)}$
$l(\theta)$ 是损失函数。

关于原理和优化算法，感觉有两篇详细的博客。
博客1
博客二

运气超好的锦鲤。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习task1：线性回归

1.线性回归的模型函数假设有nnn个样本，每个样本对应于ddd个维度和一个输出yyy，构成数据集{(x1,y1),(x2,y2),...,(xn,yn)}\{(x_1,y_1),(x_2,y_2),...,(x_n,y_n)\}{(x1,y1),(x2,y2),...,(xn,yn)}。若yyy是连续的，xxx与yyy的关系可以描述为：f(x)=θ0+θ1x1+θ2x2+...+θ...
复制链接

扫一扫