怎么把图片上的字去掉_莱迪思教你做AI设计系列（一）：下载谷歌开源图片和标签...

最新推荐文章于 2024-04-29 16:46:18 发布

weixin_39860636

最新推荐文章于 2024-04-29 16:46:18 发布

阅读量278

点赞数

文章标签：怎么把图片上的字去掉

本文链接：https://blog.csdn.net/weixin_39860636/article/details/111702268

版权

前言

如果你想建立自己的目标检测网络但是你没有足够的数据集来做训练怎么办？你可以下载 Google Open Images Dataset，这里有600类超过15M的图片和bounding box标签(15,851,536 boxes on 600 categories)。

Step 1谷歌开源数据集地址

网址链接如下：https://storage.googleapis.com/openimages/web/index.html

600类图片：

这里可以通过Explore 查看各种分类图片，在category tab里选择要查看的种类，例如选择Coffee cup就可以看到如下的图。

这里去掉Option里的所有checkbox 例如Display segmentation filling 就可以把图片上的标记去掉，查看原图了。

Step 2下载谷歌开源数据集

谷歌的数据集很大，全部都下载的话费时间费力气。所以我们去github上下载一个很实用的工具，这样我们可以只下载自己想要的数据集，该工具下载地址如下：https://github.com/EscVM/OIDv4_ToolKit

工具使用很简单：

1，下载工具并解压

2，运行 pip install -r requirements.txt 查看自己是否已经装了所有依赖库

3，装好所有库就可以使用该工具去下载数据集了，例如我想下载咖啡杯，就输入命令 python main.py downloader --classes Caffee_cup --type_csv validation

下载完成后，在…/OID/Dateset/validation文件夹下就可以查看图片和标签。

该工具还可以结合标签查看图片，首先在OID文件夹下新建一个文件夹名字叫做：visualize_folder(或者取你自己觉得方便的名字，后面对的上就行)。然后把之前下载的OID/Dataset 下的文件夹validation拷贝到OID/visualize_folder文件夹下，执行命令：python main.py visualizer --Dataset visualize_folder

输入validation(选择查看validation这个文件夹)；输入Coffee cup(选择查看Coffee cup)。

按键盘 d 查看下一张，按键盘a查看上一张。

Step 3图片分辨率与标签格式的转换

谷歌上下载的标签是VOC格式的，Lattice的参考代码需要KITTI格式的标签，这里需要把所有标签转换成KITTI格式，下图给出两种格式的对比。

谷歌上下载的图片分辨率大小各不相同，图片也需要全部转换成正方形，转换成正方形之后再将图片缩放到固定分辨率，例如Lattice的参考训练代码中用的224*224。图片大小形状改变了之后，记得标签也应该相应的改变。

准备好了图片和标签就可以做训练了，下一篇介绍Lattice Object counting 参考设计CNN训练部分。

weixin_39860636

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
怎么把图片上的字去掉_莱迪思教你做AI设计系列（一）：下载谷歌开源图片和标签...

前言如果你想建立自己的目标检测网络但是你没有足够的数据集来做训练怎么办？你可以下载 Google Open Images Dataset，这里有600类超过15M的图片和bounding box标签(15,851,536 boxes on 600 categories)。Step 1谷歌开源数据集地址网址链接如下：https://storage.googleapis.com/openi...
复制链接

扫一扫