前言
在开始之前呢,先说说自己的历程吧,最近由于要参加比赛的缘故(赛题是深度学习),开始接触python,对于我这个没有接触过python的人来说,可以说是一脸懵逼,好在有给力的队友和耐心的老师,以及得益于前辈的博客和帖子,逐渐开始弄明白一些机器学习上面的名词,摸爬滚打10多天,终于把自己的训练集训练结束以及成功截取图片,内心激动万分,分享下自己在机器学习上面踩到的坑吧。
环境搭建
在确定要接触深度学习之前,切记先看下自己的电脑配置是否达标,博主的配置为笔记本
win 10 + 965m + i5-6300cpu 在训练数据集的过程显得很乏力,所以斟酌使用。
以下为博主的环境配置:
TensorFlow-gpu:1.12.0
cuda:9.0
cudnn:7.5.1
Anaconda3:4.4.0
相关的下载教程请去网上查找,注意版本适配,这里提供一个连接可以参考:https://blog.csdn.net/gangeqian2/article/details/79358543
第一个坑
下载完object detection API如果在搭建过程中提示
module 'tensorflow.python.keras' has no attribute 'Model'
解决方法:tensorflow-gpu的版本过低,升级到较新的版本即可。
pip install tensorflow-gpu==1.8.0
这里要注意下,升级完后环境之间的适配性,也就是cudnn与cuda是否适配,与tensorflow是否适配,可以到tensorflow的官网查看,这里放一张图以及连接:https://tensorflow.google.cn/install/source_windows
第二个坑
配置过程中,提示asbl找不到
No module named 'absl' error when I import tensorflow
可以尝试升级或者重新下载absl
pip install absl
这个问题可能是我自己的问题,应该比较少出现吧。
第三个坑
Could not find 'cudart64_92.dll'. TensorFlow requires
that this DLL be installed in a directory that is named in
your %PATH% environment variable. Download and install CUDA 9.2 from this URL: https://developer.nvidia.com/cuda-toolkit
注意查看是否下载了cudnn并且配置成功,并且注意版本的适配性。
第四个坑
找不到指定模块。这个问题忘记截图保存了。
问题有点摸不清,但是提供解决的思路。
一方面,还是经常说的,环境不匹配,可以检查一下。
一方面,电脑上面的缺少vc++2015,可以查找并安装。
第五个坑
if you want to see a list of allocated tensors when oom happens...
如果训练数据集的过程中爆这个错误的话,很大概率是因为配置不行,在config中找到batch_size参数,将他改小点,或许有点用处。
总结
很大问题其实都是环境的问题,一定一定要注意环境的匹配度。