深度学习笔记No.01

最新推荐文章于 2024-05-21 11:33:10 发布

Z y..

最新推荐文章于 2024-05-21 11:33:10 发布

阅读量432

点赞数

分类专栏： python 文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_44593985/article/details/103701211

版权

3 篇文章 0 订阅

订阅专栏

对于某类任务T（Task）和性能度P（Performance Measure），如果一个计算机程序在某项任务T中，其性能P能够随着经验E（Experience）而自我完善，那么我们就称这个计算机程序在从经验中学习。

学习任务
常见的机器学习任务
1.1 分类
1.2 回归
1.3 机器翻译
1.4 结构化输出
1.5 异常检测
1.6 降噪
性能度量
查全率与查准率
查准率与查全率是一对“鱼”与“熊掌”，一般来说，查准率高时，查全率往往偏低；而查全率高时，查准率往往偏低。
学习经验
3.1 监督学习算法：试图将已知数据与该数据所对应的标记或类标（label）进行关联。
3.2 非监督学习：就是在没有指导（标记）的前提下，学习数据集内部的有用结构。最常见的非监督学习算法是聚类。

有时数据需要从环境中获取，而数据对应的标记也要从环境中获取，我们并不提供标记数据，我们只提供某种评价机制（奖励或惩罚），这样的学习方式称之为强化学习（Reinforcement Learning）。

机器学习中绝大多数任务都是优化任务，也就是去寻找最优解。
绝大多数机器学习算法学习的过程，其实就是在调整数据特征的重要性。
由于深度学习构造的函数非常复杂（模型容量大），因此深度学习会存在很多局部最优解（数据高维时鞍点更普遍），这也是深度学习所面临的最困难的挑战之一。

主要考虑两个问题：一是方向（梯度），二是步长（学习率α）。方向决定是否走在正确的道路上，而步长决定了要走多久才能到达目的地（错误率最低处）。

当机器学习算法在训练数据上错误率较高时，我们就说这是欠拟合现象；当机器学习算法的测试错误率与训练错误率差距较大时，我们就说这是过度拟合现象。

就是想要降低泛化错误率但不降低训练错误率而修改机器学习算法的一系列方法。

我们可以很粗浅地认为，机器学习其实就是通过一些优化手段去调整数据权重w（参数）。我们也了解到了梯度下降中的学习率α（步长）和正则化中权重衰减的惩罚因子λ都对机器学习算法的最终性能产生着巨大的影响，在学习过程中我们需要不停地调整学习率与惩罚因子。

我们目前说到的学习，通俗点也可以说是去寻找最佳的权重w，而学习率与惩罚因子这些设置，其实就是帮助我们去寻找最佳的权重，这些设置控制着机器学习算法的行为，我们就将其统称为超参数。
虽然超参数与参数我们都需要去调整，但通常针对参数的调整叫作学习，而对超参数的调整叫作选择。
我们将已知数据分成两大部分，一部分用于训练，一部分用于测试。而在训练数据集中我们又可分为两部分，一部分用于学习参数，我们称为训练数据集；一部分用于选择超参数，我们称之为验证数据集。而最终性能测试的数据，我们称为测试数据集。
验证数据是帮你去选择超参数的，虽然验证数据不直接参与训练过程，但进行超参数选择的时候，其实也间接地包含在整个学习过程中。

关注