深度网络 Fine-tuning方法简介

最新推荐文章于 2024-06-27 13:48:28 发布

wendox

最新推荐文章于 2024-06-27 13:48:28 发布

阅读量1.2w

点赞数 1

分类专栏： DNN

本文链接：https://blog.csdn.net/wendox/article/details/52840372

版权

本文介绍了深度网络的迁移学习方法，特别是Fine-tuning技术。Fine-tuning时，可以改变预训练网络的权值，全连接层或部分参数。根据新数据集的大小和与原始数据集的相似度来决定是否及如何进行Fine-tuning。当数据集小且相似时，用预训练的特征训练线性分类器；当数据集大且相似，可直接Fine-tuning；若数据集小且差异大，低层开始训练SVM。预训练网络的限制需要遵循原始结构，但权重共享允许灵活的输出大小和全连接层转换。

摘要由CSDN通过智能技术生成

迁移学习

有两种方式,一是卷积网络作为固定的特征提取器.拿到一个预训练好的卷积网络,去掉全连接层,吧其余的部分作为一个特征提取器.alex网络会计算一个4096D的特征向量,称之为cnn codes.有了这些特征很容易训练一个线性分类器.
另外一种方式是fine-tuning卷积网络,是本文主要介绍的内容.该方法中不仅替换掉了顶层的全连接层,而且会改变预训练网络中的权值数据.这里既可以改变全部的网络参数,也可以只改变其中一部分的参数.
使用已经训练过的模型参数,经过调整,改变模型的结构,重新开始训练,达到新的最优模型.如果原始的网络中没有新的层需要的层,那么就使用随机的权重.降低base_lr学习的速度,提高新引入的层的学习速度lr_mult.

caffe % ./build/tools/caffe train -solver models/finetune_flickr_style/solver.prototxt -weights models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel -gpu 0

使用-weight会告知caffe,需要加载一个网络模型,然后再开始训练

model zoo

可以下载其中预训练的模型来使用.

最低0.47元/天解锁文章

wendox

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
深度网络 Fine-tuning方法简介

迁移学习有两种方式,一是卷积网络作为固定的特征提取器.拿到一个预训练好的卷积网络,去掉全连接层,吧其余的部分作为一个特征提取器.alex网络会计算一个4096D的特征向量,称之为cnn codes.有了这些特征很容易训练一个线性分类器. 另外一种方式是fine-tuning卷积网络,是本文主要介绍的内容.该方法中不仅替换掉了顶层的全连接层,而且会改变预训练网络中的权值数据.这里既可以改变全部的网络
复制链接

扫一扫

专栏目录