在目标检测领域方向的相关经典文献包括Fast-RCNN、Faster-RCNN、SSD、YOLO以及RetinaNet等。话说“工欲善其事必先利其器”,而该 Object Detection API就是谷歌的牛逼工程师们开源给我们的最好“利器”。
今天我们将借助该API训练自己的数据集进行目标检测,这里选择的目标为扑克牌,收集了9,10,J,Q,K,A六类扑克。
1、下载TensorFlow Object Detection API
在github上该API存放在tensorflow/models项目下,下载地址为https://github.com/tensorflow/models
1.1安装protoc
在object_detection/protos中,可以看到一些proto文件,需要使用protoc程序将这些proto文件编译为python文件。下载地址为https://github.com/google/protobuf/releases解压后将bin文件夹中的protoc.exe放到C:\Windows下。(用于将protoc.exe所在的目录配置到环境变量当中)。