bottom up attention为py-faster-rcnn在 Visual Genome 数据集预训练的模型,官方py-faster-rcnn在COCO数据集预训练下仅识别80个class,bottom up attention可识别1600个object class以及400个属性class
论文地址:http://www.panderson.me/up-down-attention/
一、电脑配置
准备工作:
Ubuntu16.04系统
GTX1070显卡
cuda8.0+cuDNN5.1
cuda8.0以及相对应cuDNN5.1的安装不再赘述,参考:https://www.cnblogs.com/xujianqing/p/6142963.html
二、caffe编译
1.git clone
注意不要下载官网的caffe版本(py-faster-rcnn是旧版的caffe,官网是新版),直接git clone作者github
git clone https://github.com/peteanderson80/bottom-up-attention
否则会遇到版本不一致的问题,无法编译!!!
2.Build the Cython modules
(cython 通过混合C和python 的语法,可以提高python代码的运行速度)
在bottom-up-attention目录下打开终端
cd $REPO_ROOT/lib
make
3.Build Caffe
1)修改Makefile.config
$ cd caffe //到caffe的根目录下
$ mv Makefile.config.example Makefile.config
//修改Makefile文件
//用vi编辑器打开Makefile.config
修改Makefile.config是重点!!!
下面贴出我的Makefile.config(使用GPU)