梯度下降
梯度:所有偏微分构成的向量
优化器的影响因素:局部最小值、鞍点、初始状态、学习率、动量(惯性)
激活函数torch.nn.functional Sigmoid Tanh Relu
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/450a840d6c3151ebccf0e88b726506f5.png)
Loss
mse_loss() torch.autograd.grad() loss.backward
Softmax分类的激活函数
感知机
链式法则
反向传播算法
神经网络与全连接
logistic regression
classification sigmoid
交叉熵
多分类问题
激活函数和GPU加速
Relu函数比较好 Leaky Relu
可视化