深度学习入门理解——零基础数学篇（一）

小羊头发长

已于 2022-08-17 19:58:09 修改

阅读量1.4k

点赞数 3

文章标签：深度学习人工智能机器学习

于 2022-08-15 20:28:27 首次发布

本文链接：https://blog.csdn.net/gwengjing/article/details/126347149

版权

本文介绍了深度学习入门的数学基础，从回归问题出发，探讨了最小二乘法和梯度下降法在解决回归问题中的作用。通过线性回归的实例解释了梯度下降法的迭代过程，强调了激活函数在引入非线性特性中的重要性，并概述了前向传播和反向传播的概念。文章以微积分、线性代数和概率的角度解析深度学习的数学原理。

摘要由CSDN通过智能技术生成

前言

本文章仅代表作者对于入门神经网络的一些总结，不涉及高深的数学知识。

将深度学习之前我们先来了解一下什么是回归问题，关于回归问题的讲解可以直接百度，这里具体来说就是要让机器观察猫的特征或者一群学生的身高，然后根据这些特征对某种事物进行分类或预测（是否为猫，有多少个男生）

那么怎么解决回归问题呢，我们知道，机器和人不同，它不能用眼睛直观的看到这些特征，它只能看到一堆数字，一串矩阵，因此我们要让机器明白这些特征实际上是让机器在这些数字中找规律的问题。

比如这前六个数是0.14、0.57、1.29、2.29、3.57、5.14，请问第七个是几？我们把这几个数字在坐标轴上标识一下，用曲线连接这几个点，延着曲线的走势可以推算出第七个数字——7，如图：

可是机器并不能像我们人一样随手画一条先就可以这么好的拟合，那么我们怎么办才能让机器拟合这么多点呢？这个时候我们可以让机器随便画一条线y=wx+b，然后不旋转这条线（改变斜率w），还可以不断的平移（改变截距b),在这个过程中不断计算每个点到这条直线的距离（即误差），求出所有的误差之和，和越小就说明约拟合，这样不断的调整，直到误差趋近于0，这种方法就叫：最小二乘法是直接对残差求导找出全局最小，是非迭代法。