深度网络pre-train对于深度网络的意义

最新推荐文章于 2024-08-09 17:55:10 发布

cjw_seeker

最新推荐文章于 2024-08-09 17:55:10 发布

阅读量4.8k

点赞数 1

分类专栏：深度学习文章标签：优化函数网络

本文链接：https://blog.csdn.net/github_36129812/article/details/53116491

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

2016.10.11

1 pre-train 带来更好的优化还是更好的泛化？

pre-train是一个寻网络权值初值的过程，将pre-train的结果作为BP算法的权值的初值，能够解决深度网络在非凸目标函数上陷入局部最优的问题。从这个角度理解更象是带来更好的优化能力。在带有pre-train的深度网络的泛化表现上不仅仅是训练误差很小，同时泛化误差也很小，下图可以看出带有pre-train的网络在减小测试误差的能力上更优秀，感觉是pre-train的网络能够找到一个泛化能力好但是训练误差不一定好的初值，从这里更象是一个正则化的方法。