FastMaskRCNN算法TensorFlow配置,训练

打开./libs/datasets/pycocotools,执行make
下载COCO数据集,放到./data目录下,格式如下
./data
./coco
./annotations
./train2014

./val2014

annotations: http://mscoco.org/dataset/#download (Annotations前3个)
将数据转换成TFRecords
python download_and_convert_data.py
下载resnet50模型 wget http://download.tensorflow.org/models/resnet_v1_50_2016_08_28.tar.gz ,解压到./data/pretrained_models/
执行训练:
python train/train.py
出现bug:

这是由于tensorflow0.11和0.12相对较老,需要将版本改为1.0.0
先卸载老版本tensorflow
sudo su
pip uninstall tensorflow 接着输入y
pip uninstall protobuf 接着输入y
找到合适版本的安装文件链接
TF_BINARY_URL= https://storage.googleapis.com/tensorflow/ linux/gpu/tensorflow_gpu-1.0.0-cp27-none-linux_x86_64.whl

pip install --upgrade $TF_BINARY_URL
继续执行训练:
python train/train.py
出现bug

原因:cudnn版本不符合,我的是5.0,官网要求的是5.1
解决方法:更新cudnn
下载cudnn5.1
选择:cuDNN v5.1 Library for Linux
$ tar xvzf cudnn-8.0-linux-x64-v5.1.tgz$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

再次执行训练:
python train/train.py
问题解决,原始配置需要迭代250000次,我们调整libs/configs/config_v1.py
调整打印日志为:log_every_n_steps,1
总结保存:save_summaries_secs,60
模型保存:sava_interval_secs,72
运行结果如下:

运行成功。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值