机器学习--基础--线性回归原理与机器学习一般性建模思路

最新推荐文章于 2022-09-19 00:08:42 发布

xiaoxifei

最新推荐文章于 2022-09-19 00:08:42 发布

阅读量388

点赞数

分类专栏：机器学习文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/xiaoxifei/article/details/106078356

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

线性回归

文章目录

线性回归
- 原理
- 机器学习最一般性的思路

原理

线性回归是一个很基础很简单的问题。如下所示

特征1	特征2	特征3	…	标签值
$x_1^0$	$x_2^0$	$x_3^0$	…	$y_0$
$x_1^1$	$x_2^1$	$x_3^1$	…	$y_1$
…	…	…	…	…

这是一组特征值序列以及他们的标签。
线性回归实际上是认为这些特征值同标签存在着线性相关的关系，关系可以描述为:
$h_{\theta}(X)=\theta_0+\theta_1x_1+...$
这里的 $h(\theta)$ 就是 $y$ 的预测值；也就是说线性模型是指将这些特征 $x_1,x_2$ 等等代入到上面的一个线性函数里面得到对 $y$ 的预测，那么在线性回归这个任务里，剩下的就是如何求 $\theta$ 这些值了。如果预测的y是连续的，这称之为线性回归，如果y是离散的，称之为线性分类。
在线性回归中，现在最为主要的问题是如何求得这样的一组 $\theta$ 使得上述关系同真实的标签值

最为简单的办法是构建一个衡量模型效果的函数
$L(\theta)=\sum_{i=1}^{n}(h_{\theta}(x_1^i,x_2^i,...)-y_i)^2$
这个函数就将我们上面的问题转化为数学表达式，即找到一组 $\theta$ 使得在此条件下计算的预测标签同真实的标签差距最小，这个函数被称之为损失函数。

为了便于进行推演，上面的函数可以用矩阵的形式进行表达
$\frac{1}{2}(X\theta-Y)^{T}(X\theta -Y)$

假设其他条件都不做限制，我们知道求取 $L_{min}$ 的一般性方法是对 $\theta$ 求导，使导数为0，然后将导数函数变为方程，最终求出 $\theta$ ，对上面的矩阵表现形式进行求导并另导数为0，可得
$\theta = (X^TX)^{-1}X^TY$
一般而言，对于简单的函数，到这一步就可直接求出 $\theta$ ，实际应用中常常使用的是梯度下降法来求取获得适宜的 $\theta$ ,这里的内容可以参考链接，不做赘述。

机器学习最一般性的思路

从上面的步骤可以看出，机器学习的一般思路是：

构建特征值与标签之间的关系模型，这种关系模型中有大量的未知数需要求解，即定义模型
在上述关系模型的基础上，构建起求解这些未知数的模型，即定义模型的优化问题
求解优化问题，获得满足需求的这些未知数的解，从而代入关系模型，获得优化后的模型，即完成优化过程。

其他的机器学习方式，包括深度学习方式都是基于上述最一般的3个步骤进行建模进行处理，所不同的是这三个步骤的具体形制不同。

xiaoxifei

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
机器学习--基础--线性回归原理与机器学习一般性建模思路

线性回归文章目录线性回归原理机器学习最一般性的思路原理线性回归是一个很基础很简单的问题。如下所示特征1特征2特征3…标签值x10x_1^0x10x20x_2^0x20x30x_3^0x30…y0y_0y0x11x_1^1x11x21x_2^1x21x31x_3^1x31…y1y_1y1……………这是一组特征值序列以及他们的标签。线性回归实际上是认为这些特征值同标签存在着线性相关的关系，关系可以描述为:hθ(X)=
复制链接

扫一扫

专栏目录