第二章单变量线性回归

最新推荐文章于 2023-03-08 13:39:06 发布

xxatz

最新推荐文章于 2023-03-08 13:39:06 发布

阅读量666

点赞数 1

分类专栏：科研菜鸡之吴恩达机器学习笔记文章标签：线性回归梯度下降代价函数模型优化监督学习

本文链接：https://blog.csdn.net/xxayt/article/details/121792096

版权

4 篇文章 0 订阅

订阅专栏

房价模型：已知样本数据集（训练集）中的房子对应的面积和价格，学习任何预测房价（输出一个假设函数 hypothesis）。

监督学习模型，回归模型（预测连续值）

定义符号：
1. $m$ 表示数据集训练样本集的数量
2. $x$ 表示输入变量/特征
3. $y$ 表示输出变量/目标
4. $(x, y)$ 表示一个训练样本
5. $x^{(i)},y^{(i)})$ 表示特定样本，其中 $\cdot^{(i)}$ 表示索引
单变量线性回归 Univariate linear Regression：预测线性函数 $h(x)=\theta_0+\theta_1 x$

假设函数 Hypothesis： $h(x)=\theta_0+\theta_1 x$

目标：合适的选择模型参数 $\theta_i$

解决最小化问题：尽量减少预测价格和实际卖出价格的差的平方和
$\text{minimize }\theta_0,\theta_1\quad \dfrac{1}{2m}\sum\limits_{i=1}^m \left(h(x^{(i)})-y^{(i)}\right)^2$
代价函数 Cost Function(平方误差函数)：
- 定义： $J(\theta_0,\theta_1)= \dfrac{1}{2m}\sum\limits_{i=1}^m \left(h(x^{(i)})-y^{(i)}\right)^2,\quad h(x)=\theta_0+\theta_1 x$
- 使用：
  
  Hypothesis： $h_\theta(x)=\theta_0+\theta_1 x$
  
  Parameters： $\theta_0,\theta_1$
  
  Cost Function： $J(\theta_0,\theta_1)= \dfrac{1}{2m}\sum\limits_{i=1}^m \left(h(x^{(i)})-y^{(i)}\right)^2$
  
  Goal： $\min\limits_{\theta_0,\theta_1} J(\theta_0,\theta_1)$
  - 首先简化假设函数(使 $\theta_0=0$ )： $h=\theta_1x$
  - 根据不同斜率 $\theta_1$ ，得到 $J$ 关于 $\theta_1$ 的图像

目的：最小化函数值

Batch 梯度下降法：每一步下降均遍历整个数据集
- 计算步骤：
  - $\color{red}\bigodot$ 1.计算导数项： $\dfrac{\partial }{\partial \theta_j}J(\theta_0,\theta_1)=\dfrac{\partial }{\partial \theta_j}\cdot\dfrac{1}{2m}\sum\limits_{i=1}^m \left(h_\theta(x^{(i)})-y^{(i)}\right)^2=\dfrac{\partial }{\partial \theta_j}\cdot\dfrac{1}{2m}\sum\limits_{i=1}^m \left(\theta_0+\theta_1x^{(i)}-y^{(i)}\right)^2$
    $\begin{aligned}&j=0:\dfrac{\partial }{\partial \theta_0}J(\theta_0,\theta_1)=\dfrac{1}{m}\sum\limits_{i=1}^m \left(h_\theta(x^{(i)})-y^{(i)}\right)\\ &j=1:\dfrac{\partial }{\partial \theta_1}J(\theta_0,\theta_1)=\dfrac{1}{m}\sum\limits_{i=1}^m \left(h_\theta(x^{(i)})-y^{(i)}\right)\cdot x^{(i)}\\ \end{aligned}$
  - $\color{red}\bigodot$ 2.运用梯度下降法：重复计算直到收敛（一定要同时更新）
    $\begin{aligned}&\theta_0:=\theta_0-\alpha\dfrac{1}{m}\sum\limits_{i=1}^m \left(h_\theta(x^{(i)})-y^{(i)}\right)\\ &\theta_1:=\theta_1-\alpha\dfrac{1}{m}\sum\limits_{i=1}^m \left(h_\theta(x^{(i)})-y^{(i)}\right)\cdot x^{(i)}\\ \end{aligned}$
- 注意：由于线性回归代价函数的定义，所有代价函数(平方误差函数)均为凸函数 Convex function，可理解为弓形函数 Bow shaped function。于是代价函数只有全局最优解，而不存在错误的局部最优解，因此一定可以运用梯度下降法找到正确答案。

关注