深度学习总结

最新推荐文章于 2022-12-26 20:45:25 发布

小白烊

最新推荐文章于 2022-12-26 20:45:25 发布

阅读量535

点赞数

本文链接：https://blog.csdn.net/a215012954/article/details/102507799

版权

基础知识

条件表达式

 if x > 0:
    y = math.log(x)
 else:
 	y = float('nan')

→ y = math.log(x) if x > 0 else float(‘nan’)

列表式推导式

l1 = []
for i in range(1000):
	if i % 2 == 0:
		l1.append(i)

→ [i for i in range(1000) if i % 2 == 0]

科学计算库NumPy

属性

ndim属性，维度个数
shape属性，各维度大小
dtype属性，数据类型

转置

arr.transpose() 或arr.T

数据叠加

vstack()（垂直叠加）
hstack()（水平叠加）

卷积神经网络

尺寸计算（W,H,D）

W = (W - size + 2 * padding)/stride +1
H = (H - size + 2 * padding)/stride +1
D = output.number

NumPy优点

向量化(vectorization)

获得执行速度更快、更紧凑的代码策略
基本思路：“一次”在一个复杂对象上进行操作，或者向其应用某个函数，而不是通过在对象的单个元素上循环来进行
在Python级别上，函数式编程工具map，filter和reduce提供了向量化的手段
在NumPy级别上，在ndarray对象上进行的循环由经过高度优化的代码负责，大部分代码用C语言编写，远快于纯Python
矢量间运算，相同大小的数组间的运算应用在元素上
矢量和标量运算，“广播” 一将标量“广播”到各个元素

第三章

优化算法

在求数值解的优化算法中，小批量随机梯度下降在深度学习中被广泛使用。它的算法很简单：先选取一组模型参数的初始值，如随机选取：接下来对参数进行多次迭代，使每次选代都可能降低损失函数的值，在每次迭代中，先随机均匀采样一个由固定数目训练数据样本所组成的小批量β，然后求小批量中数据样本的平均损失有关模型参数的导数(梯度)，最后用此结果与预先设定的一个正数的乘积作为模型参数在本次迭代的减小量）
这里的批量大小和学习率的值是人为设定的，并不是通过模型训练学出的，因此叫作超参数。我们通常所说的“调参”指的正是调节超参数，例如通过反复试错来找到超参数合适的值。

softmax和线性回归相同点和不同点

（这一段话自己理解了答）
前几节介绍的线性回归模型适用于输出为连续值的情景。在另一类情景中,模型输出可以是一个像图像类别这样的离散值。对于这样的离散值预测问题,我们可以使用诸如 softmax回归在内的分类模型。和线性回归不同, softmax回归的输出单元从一个变成了多个,且引入了 softmax运算使输出更适合离散值的顶测和训练。