机器学习——线性回归模型详解

最新推荐文章于 2024-07-25 12:32:58 发布

丿一叶秋丶

最新推荐文章于 2024-07-25 12:32:58 发布

阅读量2.4k

点赞数 2

分类专栏：机器学习文章标签：机器学习线性回归模型梯度下降算法特征

本文链接：https://blog.csdn.net/zhuqiang9607/article/details/83655913

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

线性的含义

线性的理解：它是一条直线，这可能让我们回到初中、高中时候定义的y=ax+b，而在线性回归模型中，它是一个特征或多个特征和结果的拟合模型（好比预测房子的价格，房子的面积、房龄、房间数等等特征，而所要预测的房子的价格就是需要的结果），最终表示为线性函数关系式。

线性函数：可以把房子对应的特征整合为一组集合 $\left ( x_{1}^{j},x_{2}^{j},x_{3}^{j},\cdot \cdot \cdot ,x_{n}^{j} \right )$ ，对应的结果为 $y^{j}$ ，其中 $i$ 表示的是样本的个数，以 $j = 1$ 为例，可得线性函数关系式

$y=a_{0}+ b_{1}x_{1}+b_{2}x_{2}+b_{3}x_{3}+\cdot \cdot \cdot+b_{m}x_{m}$

线性回归模型：说白了就是一个函数，好比求解 $f (x) = a x + b$ ，而要求解的函数往往写成

$h_{\theta}(x)=h_{0}+ \theta_{1}x_{1}+\theta_{2}x_{2}+\theta_{3}x_{3}+\cdot \cdot \cdot+\theta_{m}x_{m}$

此外，为了方便合并，都会添加 $x_{0}=1$ 这项，于是函数为

$h_{\theta}(x)=\theta_{0}x_{0}+ \theta_{1}x_{1}+\theta_{2}x_{2}+\theta_{3}x_{3}+\cdot \cdot \cdot+\theta_{m}x_{m}$

然后，更简洁的公式出来了，如下

$h_{\theta}(x)=\sum_{i=0}^{m}\theta_{i}x_{i}=\theta^{T}X$

其中， $\theta_{i}$ 是 $x_{i}$ 对应的权值（系数）， $\theta^{T}、X$ 分别表示权值向量、特征向量，而实际工业中 $X$ 是已知的一些样本，而所要求的是 $\theta^{T}$ ，求出来了，那模型也就有了。

线性回归模型求解

为了求解 $\theta^{T}$ ，会先定义损失函数（或成本函数）

$J(\theta)=\frac1{2m}\sum_{i=0}^{m}(h_{\theta}(x^{i})-y^{i})^{2}$

然后需要尽量减小 $J(\theta)$ ，常用的方法有梯度下降法（Gradient Descent），牛顿法和拟牛顿法，模拟退火法（Simulated Annealing）等等，这里以梯度下降法为例，公式为

$\theta_{j}:=\theta_{j}-\alpha\frac\partial{\partial\theta_{j}}J(\theta)$

其中 $\alpha$ 是步长，步长太大，容易错过 $a r g$ $min(J(\theta))$ ，太小效率太慢，有的情况会落入局部最小值。

在合适的情况下才能取得全局最小值点

然后， $J(\theta)$ 代入可得

$\theta_{j}:=\theta_{j}-\alpha\sum_{i=0}^{m}(h_{\theta}(x^{i})-y^{i})x_{j}^i$

得到新的 $\theta_{j}$ 代入 $J(\theta)$ 中，反复迭代，直到两次 $\theta_{j}$ 相等或差值小于人为设定的阈值（超参数），这时的 $h_{\theta}(x)$ ，即为要找的模型。

结语

本文对线性回归模型做了简单的分析，但由于实际中的应用，可能会有各种各样的变种，但是有必要先了解最基本模型的原理，以及处理方式，以至于不把机器学习当黑盒使用。不可避免的文中还有很多不足之处，有待进一步完善。

丿一叶秋丶

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
机器学习——线性回归模型详解

机器学习——线性回归模型简单分析线性的含义**线性是什么？**字面理解是一条直线，这可能让我们回到初中、高中时候的定义的y=ax+b，而在线性回归模型中，它是一个特征或多个特征和结果的拟合模型（好比预测房子的价格，房子的面积、房龄、房间数等等表示的是特征，而所要预测的房子的价格就是需要的结果）...
复制链接

扫一扫

专栏目录