零基础深度学习：预备知识（二）

最新推荐文章于 2024-10-19 14:36:08 发布

★seele★

最新推荐文章于 2024-10-19 14:36:08 发布

阅读量254

点赞数 3

文章标签：深度学习笔记深度学习

本文链接：https://blog.csdn.net/2301_78018881/article/details/142598971

版权

1.1 微积分

我们首先讨论导数的计算，这是几乎所有深度学习优化算法的关键步骤。在深度学习中，我们通常选择对于模型参数可微的损失函数。简而言之，对于每个参数，如果我们把这个参数增加或减少一个无穷小的量，可以知道损失会以多快的速度增加或减少。

假设我们有一个函数f（x），其输入和输出都是标量。如果f（x）导数存在，这个极限被定义为：

为了更好地解释导数，让我们做一个实验。定义f（x）=3x²–4x如下：

通过令x=1并让h趋近0，f'（x）的数值结果趋近于2，虽然这个实验不是一个数学证明，但稍后会看到，当x=1时，导数f'（x）是2。

结果：

掌握了导数的计算方法，接下来可以求曲线的切线方程并且绘制图像：

结果：

1.2 概率论

简单地说，机器学习就是做出预测。根据病人的临床病史，我们可能想预测他们在下一年心脏病发作的概率。在飞机喷气发动机的异常检测中，我们想要评估一组发动机读数为正常运行情况的概率有多大。在强化学习中，我们希望智能体（agent）能在一个环境中智能地行动。这意味着我们需要考虑在每种可行的行为下获得高奖励的概率。当我们建立推荐系统时，我们也需要考虑概率。例如，假设我们为一家大型在线书店工作，我们可能希望估计某些用户购买特定图书的概率。为此，我们需要使用概率学。

假设我们掷骰子，想知道看到1的几率有多大，而不是看到另一个数字。如果骰子是公平的，那么所有六个结果都有相同的可能发生，因此我们可以说1发生的概率为1/6。

然而现实生活中，对于我们从工厂收到的真实骰子，我们需要检查它是否有瑕疵。检查骰子的唯一方法是多次投掷并记录结果。对于每个骰子，我们将观察到1到6中的一个值。对于每个值，一种自然的方法是将它出现的次数除以投掷的总次数，即此事件（event）概率的估计值。大数定律（law of large numbers）告诉我们：随着投掷次数的增加，这个估计值会越来越接近真实的潜在概率。让我们用代码试一试。

首先，我们导入必要的软件包。