GPU环境配置与Faster-Rcnn训练记录
我是参考Bubbliiiing博主的内容进行学习的,这是他的主页:
https://blog.csdn.net/weixin_44791964?spm=1001.2014.3001.5509
关于windows下的tensorflow-gpu=1.13.2环境配置可参考:
https://blog.csdn.net/weixin_44791964/article/details/104702142
我在这里只是记录一下我自己的操作流程。
具体的环境内容如下:
tensorflow-gpu:1.13.2
keras:2.1.5
numpy:1.17.4
我的电脑配置:
win10, 1050ti, 显存4G
Anaconda的安装就不说了,直接从cuda的安装说起,安装时需要注意以下几个问题:
- 安装cuda时,许可协议里选自定义,只选择CUDA,并且取消勾选CUDA里的visual studio integration选项。
- 添加系统环境变量:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64,并上移到第3位。(这一步很重要)
查看cuda的版本
tensorflow-gpu的环境创建
conda create -n ten python=3.6 在conda下创建新环境,ten为环境名称,如需要指定python,后面可加版本。
pip list 查看该环境下的包及版本
如果里面有tensorflow系列,需要删除,如下:
最后清理到清单里只剩下这些,就OK了,如下:
安装自己想要安装的tensorflow-gpu版本,
pip install tensorflow-gpu==1.13.2 -i https://pypi.douban.com/simple
安装keras
在pycharm里添加自己创建的环境
Pycharm添加已存在的环境是在 existing environment 这里面找,如下:
这就是安装的大致过程,下面是一些小小的收获:
1、conda info -e 查看conda创建的环境。
2、在创建好的环境里,缺啥安装啥就行,可以指定版本。
3、-i https://pypi.douban.com/simple 加上这个下载比较快。
Faster-rcnn训练记录
刚开始没有配置好GPU,所以使用CPU进行训练,我的数据集只标注了100幅,图像分辨率为1350*1080,迭代100次,训练了36个小时,loss曲线是输入到excel里做的,目前我还不会让它自动生成。
最后的预测效果就是这样的:
在GPU上训练的话,我只训练40次显存就爆了…,所以没有训练成功。
总结:
- 学会了在conda里创建环境,这样对下载的不同代码可以单独创建一个相配套的环境。
- 数据集太少了,训练的loss值有点大(也可能是参数设置的问题)。
- 一些模型评价指标需要尽快了解。