1.模型下载
fcn模型及各种配置文件下载
https://github.com/shelhamer/fcn.berkeleyvision.org
或者
$ git clone https://github.com/shelhamer/fcn.berkeleyvision.org.git
caffemodel下载地址在每个子文件夹下
我目前用的是voc-fcn32s
2.自己的数据集制作
-
数据集包括image和label,image是RGB,.jpg格式;
label是单通道的,.png格式,背景为0,前景按分类分别为1,2,3… -
关于图像标注,可以用ps或者matlab的labelme工具包
-
将数据分成train,val,test,分别生成单个txt,txt内容为图片名称(.jpg之前的内容)
3.fcn文件修改
-
train.protxt 和 val.protxt
修改data层参数:路径,txt名称 -
solve.py
修改caffemodel路径
修改caffe.set_device() -
voc_layers.py
class VOCSegDataLayer()定义的是val数据,加载val.protxt
class SBDDSegDataLayer()定义的是train数据,加载train.protxt
这里,原始fcn训练时输入的label是.mat格式,这里改成.png格式
具体修改参照博客http://blog.csdn.net/supe_king/article/details/58121993
4.终端运行solve.py或者pycharm等软件运行