吴恩达机器学习笔记

最新推荐文章于 2023-04-25 15:39:17 发布

「已注销」

最新推荐文章于 2023-04-25 15:39:17 发布

阅读量555

点赞数 2

分类专栏：机器学习文章标签：机器学习吴恩达课程笔记

本文链接：https://blog.csdn.net/xushunag/article/details/95868123

版权

本文是吴恩达机器学习课程的详细笔记，涵盖了从线性回归到神经网络的关键概念和算法，包括梯度下降、正则化、逻辑回归和多类别分类问题。深入探讨了过拟合的解决方案，并对线性代数进行了回顾。笔记主要聚焦于前7章，是理解机器学习基础知识的重要参考资料。

摘要由CSDN通过智能技术生成

本文为吴恩达机器学习视频听课笔记，仅记录课程大纲及对于部分关键点、疑难点的理解。
课程链接: 吴恩达机器学习.

说明：这篇博客已经躺在草稿箱里很久了由于整理公式等耗费大量时间仅仅梳理了前 7章的内容后续内容若有时间再做整理

本章主要介绍了机器学习的定义、算法分类及应用场景。
图1 机器学习概论

监督学习算法工作过程
Linear Regression Model

$h_{θ}(x)=θ_0+θ_1x$

$\mathrm J(θ_0,θ_1)=\cfrac {1}{2m}\displaystyle\sum_{i=1}^m(h_{θ}(x^{(i)})-y^{ {(i)}})^{2}$

项目	Value
假设函数	$h_{θ}(x)=θ_0+θ_1x$
参数	$θ_0$ , $θ_1$
代价函数	$\mathrm J(θ_0,θ_1)=\cfrac {1}{2m}\displaystyle\sum_{i=1}^m(h_{θ}(x^{(i)})-y^{ {(i)}})^{2}$
目标	$\mathrm J(θ_0,θ_1)$

注意：

（一种可以自动找到使得函数J最小的参数的算法）

定义：
repeat until convergence{
$θ_j:= θ_j-α\cfrac {\partial}{\partialθ_j}\mathrm J(θ_0,θ_1)$ (for j=0 and j=1)
}
关于α（学习率）
（1）学习率表示在控制梯度下降时，以多大的幅度更新参数（采用同时更新的方法，即 $θ_0$ 和 $θ_1$ 同时更新）
（2）if α is too small, gradient descent can be slow
（3）if α is too large, gradient descent can overshoot the minimum. It may fail to converge, or even diverge.

线性回归模型

$h_{θ}(x)=θ_0+θ_1x$

$\mathrm J(θ_0,θ_1)=\cfrac {1}{2m}\displaystyle\sum_{i=1}^m(h_{θ}(x^{(i)})-y^{ {(i)}})^{2}$
梯度下降算法

repeat until convergence{
$θ_j:= θ_j-α\cfrac {\partial}{\partialθ_j}\mathrm J(θ_0,θ_1)$ (for j=0 and j=1)
}
Apply gradient descent to minimize squared error cost function

求偏导：
$\cfrac {\partial}{\partialθ_j}\mathrm J(θ_0,θ_1)=\cfrac {\partial}{\partialθ_j}\cfrac {1}{2m}\displaystyle\sum_{i=1}^m(h_{θ}(x^{(i)})-y^{ {(i)}})^{2}=\cfrac {\partial}{\partialθ_j}\cfrac {1}{2m}\displaystyle\sum_{i=1}^m(θ_0+θ_1x^{(i)}-y^{ {(i)}})^{2}$