一文搞懂线性回归和逻辑回归

最新推荐文章于 2023-11-19 14:44:56 发布

进击的西西弗斯

最新推荐文章于 2023-11-19 14:44:56 发布

阅读量5.1k

点赞数 10

分类专栏：知识总结文章标签：逻辑回归线性回归机器学习算法

本文链接：https://blog.csdn.net/qq_42216093/article/details/121217614

版权

本文详细介绍了线性回归和逻辑回归的基础概念，包括线性回归的单变量模型构建、梯度下降法及其解决过拟合的方法，以及逻辑回归的模型构建、Sigmoid函数的应用和决策边界。线性回归适用于连续变量预测，而逻辑回归则用于二分类问题，通过Sigmoid函数将预测结果转化为概率。两者都是通过梯度下降法优化模型参数，可采用正则化避免过拟合。

摘要由CSDN通过智能技术生成

1.线性回归（Linear Regression）

1).介绍

线性回归是机器学习中最基础、最经典的算法之一，它利用线性函数对一个或多个自变量和因变量之间关系进行建模，建模过程就是使用数据点来寻找最佳拟合线。线性回归分为两种类型：单变量线性回归(Linear Regression with One Variable)，一个自变量和一个结果变量，能在二维平面可视化；和 多变量线性回归(Linear Regression with Multiple Variables)，至少两组自变量。

有一点需要注意，“线性回归”中的“线性”指的是因变量关于参数是线性的，而不是关于自变量，比如模型： $Y_{i}=\beta_{1} X_{i}+\beta_{2} X_{i}^{2}+\varepsilon_{i}$ ，因变量对于参数 $\beta_{1}$ 和 $\beta_{2}$ 是线性的，但对于自变量 $X_{i}$ 来说就是非线性的，这任然是一个线性回归模型。

优点：线性回归的理解与解释都十分直观，并且还能通过正则化来降低过拟合的风险。另外，线性模型很容易使用随机梯度下降和新数据更新模型权重。
缺点：面对样本属性数量（维度）较大的复杂模型时，会因为计算量过大而无能为力，比如图像识别问题。

2).单变量线性回归模型构建

预测函数（hypothesis）：

$h_{\theta}(x)=\theta_{0}+\theta_{1} x$

这是用来拟合样本数据点的拟合线，我们的目标是找到最优的 $\theta_{0}$ 和 $\theta_{1}$ 使得拟合效果最好。

损失函数（Loss Function ）：

$L^{(i)}=h_{\theta}\left(x^{(i)}\right)-y^{(i)}$

这是单个样本预测结果和正确结果的误差值。

代价函数（Cost Function ）：

$J\left(\theta_{1}, \theta_{2}\right)=\frac{1}{2 m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right)^{2}$

代价函数是关于参数 $\theta$ 的函数，代表所有样本损失函数的总和，用来衡量评估模型的好坏，一般情况下它的值越小则模型越好。

3).梯度下降法（Gradient Descent）

前面已经构建好了预测函数和代价函数，接下来就要求解最优参数，使其能够让代价函数值最小。梯度下降法是一种求解机器学习模型最优参数的经典方法。

梯度下降法原理

分别对于每个参数 $\theta_{}$ ，求出代价函数关于该参数的偏导数，也就是代价函数在该参数方向上的斜率，然后根据斜率的符号来调整参数值，由于一个函数的偏导数方向是函数增长最快的方向，因此负偏导数就是代价函数梯度下降最快的方向，相应的斜率值也会不断趋近于0，迭代过程会使得代价函数 $J\left(\theta_{0}, \theta_{1}\right)$