深度学习理论向应用的过渡课程【北京大学_TensorFlow2.0笔记】学习笔记（四）——损失函数，过拟合，优化器

m0_58586235

已于 2022-03-20 20:02:01 修改

阅读量382

点赞数

分类专栏：北京大学TensorFlow 文章标签：学习深度学习人工智能

于 2022-03-17 23:32:31 首次发布

本文链接：https://blog.csdn.net/m0_58586235/article/details/123563298

版权

12 篇文章 3 订阅

订阅专栏

通常包括：MSE，Cross Entropy（与softmax结合），自定义函数

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

分界线思想：将网格的每一个坐标送入神经网络，输出值为（0，1），对应不同的分类。将所有输出值0.5的点连成线。

优化器：引导神经网络更新参数的工具。不同优化器在定义一阶、二阶动量公式上不同。

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

batch通常为2^n个数据

1、SGD：随机梯度下降（无动量）

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

定义方式：

w1.assign_sub( lr * grad[0] )

b1.assign_sub( lr * grad[1] )

2、SGDM

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

mt公式表示各时刻梯度方向的指数滑动平均值

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

3、Adagrad——在SGD基础上加入二阶动量

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

4、RMSProp——在SGD基础上加入二阶动量

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

5、Adam——同时结合SGDM一阶动量+RMSProp二阶动量

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

关注