目标:完成水下鱼类分割
使用的网络:
mpnet:Learning Motion Patterns in Videos
paper & code: http://thoth.inrialpes.fr/research/mpnet
DeepLabV2(ResNet-101):code: https://github.com/DrSleep/tensorflow-deeplab-resnet
前言:使用了一款记笔记的软件,幕布,风格极简,但保存代码还是差了一点。
另外这几天的鼓捣,经常上网上查资料,发现将自己遇到的问题和解决方法记录下来,
以后再遇到好解决,还可以帮助别人。
正文:
首先是mpnet的实现
一 torch的安装
网址:百度下torch就出来了,itorch也是,安装之前先看看为下边这两段话。
预训练使用的数据集非常大,论文使用的显卡计算能力非常强大,我这里资源有限,所以使用预训练好的模型就可以了。
整个代码都是用lua语言写的,所以先安装torch,为方便调试使用了itorch;刚开始显卡不给力,出现以下的错误
THCudaCheck FAIL file=/home/nvidia/torch/extra/cunn/lib/THCUNN/generic/SpatialUpSamplingBilinear.cu line=63 error=7 : too many resources requested for launch
/home/nvidia/torch/install/bin/luajit: ...e/nvidia/torch/install/share/lua/5.1/threads/threads.lua:179: [thread 1 endcallback] /home/nvidia/torch/install/share/lua/5.1/nn/Container.lua:67:
好像是显卡的线程数不够了,
参考:https://stackoverflow.com/questions/26201172/cuda-too-many-resources-requested-for-launch
就换了一款自带牛x显卡(TITAN Black,作图像处理,还没听说有人用这个。。。。)的电脑,重新安装了torch,导入模型时发现了一个问题,模型导入过程中,出现out of memory,使用itorch一句一句的排查才发现是模型导入的问题,之前以为是数据的batch太大,后来为把batch设置成1,还是out of memory(其实不需要一句一句的查,看错误位置就可以了,但是不敢相信模型还能大到这种程度),就去网上查了查。