前言
如果你想建立自己的目标检测网络但是你没有足够的数据集来做训练怎么办?你可以下载 Google Open Images Dataset,这里有600类超过15M的图片和bounding box标签(15,851,536 boxes on 600 categories)。
Step 1谷歌开源数据集地址网址链接如下 :https://storage.googleapis.com/openimages/web/index.html
600类图片:
这里可以通过Explore 查看各种分类图片,在category tab里选择要查看的种类,例如选择Coffee cup就可以看到如下的图。
这里去掉Option里的所有checkbox 例如Display segmentation filling 就可以把图片上的标记去掉,查看原图了。
谷歌的数据集很大,全部都下载的话费时间费力气。所以我们去github上下载一个很实用的工具,这样我们可以只下载自己想要的数据集,该工具下载地址如下:https://github.com/EscVM/OIDv4_ToolKit
工具使用很简单:
![a1581f6dbf80da2753d442df39a20e0e.gif](https://i-blog.csdnimg.cn/blog_migrate/424043652446c8a332c1fc0b05cb7be8.gif)
![a1581f6dbf80da2753d442df39a20e0e.gif](https://i-blog.csdnimg.cn/blog_migrate/424043652446c8a332c1fc0b05cb7be8.gif)
1,下载工具并解压
2,运行 pip install -r requirements.txt 查看自己是否已经装了所有依赖库
3,装好所有库就可以使用该工具去下载数据集了,例如我想下载咖啡杯,就输入命令 python main.py downloader --classes Caffee_cup --type_csv validation
下载完成后,在…/OID/Dateset/validation文件夹下就可以查看图片和标签。
该工具还可以结合标签查看图片,首先在OID文件夹下新建一个文件夹名字叫做:visualize_folder(或者取你自己觉得方便的名字,后面对的上就行)。然后把之前下载的OID/Dataset 下的文件夹validation拷贝到OID/visualize_folder文件夹下,执行命令:python main.py visualizer --Dataset visualize_folder
输入validation(选择查看validation这个文件夹);输入Coffee cup(选择查看Coffee cup)。
按键盘 d 查看下一张,按键盘a查看上一张。
谷歌上下载的标签是VOC格式的,Lattice的参考代码需要KITTI格式的标签,这里需要把所有标签转换成KITTI格式,下图给出两种格式的对比。
谷歌上下载的图片分辨率大小各不相同,图片也需要全部转换成正方形,转换成正方形之后再将图片缩放到固定分辨率,例如Lattice的参考训练代码中用的224*224。图片大小形状改变了之后,记得标签也应该相应的改变。
准备好了图片和标签就可以做训练了,下一篇介绍Lattice Object counting 参考设计CNN训练部分。
![8c0edbb8bbc94684773332f6dcc4cb4a.gif](https://i-blog.csdnimg.cn/blog_migrate/ebe74f778bb00b8632a3e20bca6b2cdc.gif)