Caffe学习（未完）

最新推荐文章于 2022-04-27 18:54:19 发布

LeeJiajun

最新推荐文章于 2022-04-27 18:54:19 发布

阅读量3k

点赞数 1

分类专栏：学习&阅读深度学习文章标签：机器学习深度学习谷歌 buffer

本文链接：https://blog.csdn.net/JiaJunLee/article/details/50456830

版权

学习&阅读同时被 2 个专栏收录

42 篇文章 3 订阅

订阅专栏

深度学习

27 篇文章 1 订阅

订阅专栏

前言
Caffe上手
Google Protocol Buffer
- 1test_iter和test_interval
在 Caffe 中如何计算卷积
问题汇总待补充
- 1 训练不收敛loss居高不下

1. 前言

Caffe是大神贾扬清在加州伯克利大学博士期间开发的深度学习框架，在学界和工业界得到广泛应用。
Caffe是CNN模型的非常好的框架，方便、易用；torch7是机器学习一个非常好的框架，但是，学习曲线比caffe要陡峭一些。torch7更灵活，能搞定更多的机器学习算法模型。

2. Caffe上手

Caffe 深度学习框架上手教程: 启蒙型文章，必看。
怎么在Caffe中配置每一个层的结构: 讲的相当详细，里面对卷积后的高宽计算我有异议，可以参考4.中的“卷积后长宽计算”。

3. Google Protocol Buffer

我的基于用户的角度来理解这是一个标准，当大家都遵守这个标准，那么就可以做通讯协议，可以使语言无关，平台无关。那么，它的干货部分是Protocol Buffer是一种轻便高效的结构化数据存储格式。

3.1test_iter和test_interval

首先说明一个概念：在caffe中的一次迭代iterration指的是一个batch，而不是一张图片。

test_iter: 在测试的时候，需要迭代的次数，即test_iter* batchsize（测试集的）=测试集的大小，测试集batchsize可以在prototx文件里设置
test_interval:interval是区间的意思，所有该参数表示：训练的时候，每迭代500次就进行一次测试。

caffe在训练的过程是边训练边测试的。训练过程中每test_interval次迭代（也就是test_interval*batchsize个训练样本参与了计算），计算一次测试误差。计算一次测试误差就需要包含所有的测试图片，这样可以认为在一个epoch里，训练集中的所有样本都遍历以一遍，但测试集的所有样本至少要遍历一次，至于具体要多少次，也许不是整数次，这就要看代码，大致了解下这个过程就可以了。

4. 在 Caffe 中如何计算卷积？

卷积看成是多个局部的全连接。
卷积后长宽计算(方形):
outputh=imageh+pad−kernelhstride+1
- 上述公式错误，感谢朝朝与暮暮指出错误
- 正确公式为：
  - $o u t p u t w = ⌊ i m a g e w + 2 p a d - k e r n e l s i z e s t r i d e ⌋ + 1$ $output_w=\lfloor\frac{image_w+2pad-kernel_{size}}{stride}\rfloor+1$
  - $o u t p u t h = ⌊ i m a g e h + 2 p a d - k e r n e l s i z e s t r i d e ⌋ + 1$ $output_h=\lfloor\frac{image_h+2pad-kernel_{size}}{stride}\rfloor+1$
  - 其中stride大于等于1
  - 一般来说下式应整除，如此才能将image的所有数据进行卷积，避免数据丢失 $i m a g e w o r h + 2 p a d - k e r n e l s i z e s t r i d e$ $\frac{image_{w\,or \, h}+2pad-kernel_{size}}{stride}$
知乎-贾扬清: 里回答不是很详细，但是图片很生动，关键是作者亲临，必须要放上来。
Convolution in Caffe: a memo: 卷积算法。
如何理解卷积，另外如何理解图像处理中的卷积？: 最佳答案进行了多角度说明，如果对模版、滤波器、卷积核名词有过了解，看了后可以加深它们共性的认识。
Caffe源码阅读（2）卷积层: 代码跟读，深入理解。