因为csdn不支持文件直接显示,写ipynb文件有些难受,所以先把文件托管到我的github里面,可从github浏览。
首先将caffe的根目录作为当前目录,然后加载caffe程序自带的小猫图片,并显示。
图片大小为360x480,三通道
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import caffe
caffe_root='/home/yeler82/caffe/'
import os,sys
os.chdir(caffe_root)
sys.path.insert(0,caffe_root+'python')
im = caffe.io.load_image('examples/images/cat.jpg')
print im.shape
plt.imshow(im)
plt.axis('off')
当我尝试显示图片的时候报了这个错误'module' object has no attribute 'to_rgba'
谷歌了一下,应该是matplotlib版本问题,于是查看其版本
然后尝试更新matplotlib版本,执行以下命令,一定是要更新python2使用的matplotlib版本
sudo pip install -U matplotlib
然后我们将jupyter notebook重启一下,发现ok了。
打开examples/net_surgery/conv.prototxt文件,修改两个地方
一是将input_shape由原来的是(1,1,100,100)修改为(1,3,100,100),即由单通道灰度图变为三通道彩色图。
二是将过滤器个数(num_output)由3修改为16,多增加一些filter, 当然保持原来的数不变也行。
其它地方不变,修改后的prototxt如下:只有一个卷积层
! cat examples/net_surgery/conv.prototxt
# Simple single-layer network to showcase editing model parameters.
name: "convolution"
input: "data"
input_shape {
dim: 1
dim: 3
dim: 100
dim: 100
}
layer {
name: "conv"
type: "Convolution"
bottom: "data"
top: "conv"
convolution_param {
num_output: 16
kernel_size: 5
stride: 1
weight_filler {
type: "gaussian"
std: 0.01
}
bias_filler {
type: "constant"
value: 0
}
}
}
将图片数据加载到blobs,但反过来,我们也可以反过来从blob中提取出原始数据,并进行显示。
显示的时候要注意各维的顺序,如blobs的顺序是(1,3,360,480),从前往后分别表示1张图片,3三个通道,图片大小为360x480,需要调用transpose改变为(360,480,3)才能正常显示。
其中用data[0]表示第一张图片,下标从0开始,此例只有一张图片,因此只能是data[0]。分别用data[0,0],data[0,1]和data[0,2]表示该图片的三个通道。
这是16个滤波器的可视化结果。
这是图片经过卷积的结果