【AI之路】如何开始一个深度学习

CodeSlogan

已于 2022-09-03 18:50:17 修改

阅读量666

点赞数

分类专栏： AI 文章标签：深度学习机器学习

于 2021-09-21 16:25:58 首次发布

本文链接：https://blog.csdn.net/comscience/article/details/120402769

版权

13 篇文章 1 订阅

订阅专栏

1. 如何开始一个深度学习？

Function with unknown parameters

w and b are unknown parameters

w -> weight b->bias
Define loss from training data
Optimization

梯度下降，算积分，使得Loss趋近于最小

可反复增加层数，来达到建立深度神经网络的目的，如下图所示。由图也不难看出，神经网络其实并没有我们想象的那么抽象，我们可以将其视为参数的叠加累计。

解决方法：

首先判断在训练数据上的损失，在保证小的情况下再判断测试数据的损失

local minima and saddle point

海塞矩阵: 用于确定区分局部最小值与鞍点

在梯度为0的情况下，计算L()，以此判断鞍点与局部最小

求二次偏导，构成hessian matrix，若此时特征值有正有负，则这个点为鞍点

选取特征值为负所对应的特征向量u

uTHu

用这种方法可逃离鞍点，降低loss

batch and momentum

结论：

batch size 代表将训练资料分成多少块(batch)，每块的大小即为Batch Size

在没有平行计算时，小的batch自然比大的batch计算的要快，这就好比计算10道数学题和计算100道数学题之间的区别
有平行计算时，由于batch中的资料是同时开始计算，所花费的时间等同于计算1道数学题的时间
一次epoch代表利用所有分好的batches进行训练，每个batch内的计算是基于平行计算，因此，如果batch分的小，那么计算次数就多，计算速度就慢；反之速度就快
Noisy的数据有利于训练
small batch有助于跳出局部最优解

关注