tensorflow object detection API
创造一些精确的机器学习模型用于定位和识别一幅图像里的多元目标仍然是一个计算机视觉领域的核心挑战。tensorflow object detection API是一个开源的基于tensorflow的框架,使得创建,训练以及应用目标检测模型变得简单。在谷歌我们已经确定发现这个代码对我们的计算机视觉研究需要很有用,我们希望这个对你也会很有用。
1. 安装tensorflow以及下载object detection api
安装tensorflow:
对于CPU版本:pip install tensorflow
对于GPU版本:pip install tensorflow-gpu
升级tensorflow到最新版1.4.0:pip install --upgrade tensorflow-gpu
安装必须库:
sudo pip install pillow
sudo pip install lxml
sudo pip install jupyter
sudo pip install matplotlib
protobuf编译:在tensorflow/models/research/目录下
protoc object_detection/protos/*.proto --python_out=.
添加pythonpath,在tensorflow/models/research/目录下
export PYTHONPATH=$PYTHONPATH:`pwd`:`pwd`/slim
测试安装:
python object_detection/builders/model_builder_test.py
下载object detection api:
git clone
https://github.com/tensorflow/models.git
2.运行演示文件:object_detection_tutorial.ipynb
2.训练数据集准备
在model下新建文件夹dataset,将我使用的pascal voc格式数据集(VOC3000)转换为TFRecord格式,并存放在dataset文件夹下: