怎么把图片上的字去掉_莱迪思教你做AI设计系列(一):下载谷歌开源图片和标签...

5a53dd40088c6d97a1861af62853772d.gif

5a53dd40088c6d97a1861af62853772d.gif

前言

5a53dd40088c6d97a1861af62853772d.gif

5a53dd40088c6d97a1861af62853772d.gif

如果你想建立自己的目标检测网络但是你没有足够的数据集来做训练怎么办?你可以下载 Google Open Images Dataset,这里有600类超过15M的图片和bounding box标签(15,851,536 boxes on 600 categories)。

Step 1谷歌开源数据集地址

网址链接如下 :https://storage.googleapis.com/openimages/web/index.html

600类图片:

99e9c9dc8922fd80b0cb4b92c5e0256c.png

这里可以通过Explore 查看各种分类图片,在category tab里选择要查看的种类,例如选择Coffee cup就可以看到如下的图。

595150d5086931ad5167200ef9602798.png

这里去掉Option里的所有checkbox 例如Display segmentation filling 就可以把图片上的标记去掉,查看原图了。

83a316bc58cfae68bc84dfaef93270ca.png

Step 2下载谷歌开源数据集

谷歌的数据集很大,全部都下载的话费时间费力气。所以我们去github上下载一个很实用的工具,这样我们可以只下载自己想要的数据集,该工具下载地址如下:https://github.com/EscVM/OIDv4_ToolKit

工具使用很简单:

a1581f6dbf80da2753d442df39a20e0e.gif a1581f6dbf80da2753d442df39a20e0e.gif

1,下载工具并解压

2,运行 pip install -r requirements.txt 查看自己是否已经装了所有依赖库

3,装好所有库就可以使用该工具去下载数据集了,例如我想下载咖啡杯,就输入命令 python main.py downloader --classes Caffee_cup --type_csv validation

68bcf8bef4e33d4ca5ac95c0db14bb0f.png

下载完成后,在…/OID/Dateset/validation文件夹下就可以查看图片和标签。

a8f16f80f7adee49bcef2fa49c819e62.png

该工具还可以结合标签查看图片,首先在OID文件夹下新建一个文件夹名字叫做:visualize_folder(或者取你自己觉得方便的名字,后面对的上就行)。然后把之前下载的OID/Dataset 下的文件夹validation拷贝到OID/visualize_folder文件夹下,执行命令:python main.py visualizer --Dataset visualize_folder

14c6ee03233cc7f2e3eb45c031a7b958.png

输入validation(选择查看validation这个文件夹);输入Coffee cup(选择查看Coffee cup)。

449205bd03eedc9c13e81e8949d1b44b.png

按键盘 d 查看下一张,按键盘a查看上一张。

347188d38ab672118cc8aaf11385765a.png

82aa2857eb81635d99f771a7c891949f.png

Step 3图片分辨率与标签格式的转换

谷歌上下载的标签是VOC格式的,Lattice的参考代码需要KITTI格式的标签,这里需要把所有标签转换成KITTI格式,下图给出两种格式的对比。

289360a52857afab96546b1176848e73.png

谷歌上下载的图片分辨率大小各不相同,图片也需要全部转换成正方形,转换成正方形之后再将图片缩放到固定分辨率,例如Lattice的参考训练代码中用的224*224。图片大小形状改变了之后,记得标签也应该相应的改变。

8f07ac0690c43c35bd79c5cec86ffc2e.png

98ae2e5dbef5cc8a0c6994fc43278259.png

准备好了图片和标签就可以做训练了,下一篇介绍Lattice Object counting 参考设计CNN训练部分。

8c0edbb8bbc94684773332f6dcc4cb4a.gif
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值