数据集
漆比特
意疏的博客
展开
-
在自建的数据集上训练yolov3准备(一):按照物体类别(单类&多类)快速准确下载Open Images V4数据集、保存成yolo3标注格式并用yolo_mark验证(附python脚本)。
前言 Open Images V4是谷歌在2018年开放的一个约900万(9M)图像的数据集,被分成训练集,验证集和测试集三个部分。使用图像级标签(image-level labels),目标边界框(object bounding boxes)和视觉关系(visual relationships)进行注释。图像级标签:有近两万个不同的类具有标签,有些为人工标注,有些为机器标注。目...原创 2019-03-30 18:11:01 · 5585 阅读 · 8 评论 -
在自建的数据集上训练yolov3准备(二):树莓派自动采集图片,tensorflow_label_tool下载图片,yolo_mark标注与清洗数据(附python脚本)
前言 上一篇文章写了如何在Google的open image v4上分类下载数据集并保存成yolo格式,这里接着写。为了确认标注没有问题,我们可以用yolo_mark来清洗一遍。而有时可能我们需要自己采集数据,这里我用树莓派加上一个广角摄像头完成了我的采集任务。如果可以,我们还可以在网上去爬一些数据回来,这里我用了github上的一个小工具,效果还不错。准备树莓派 us...原创 2019-04-08 14:22:49 · 1857 阅读 · 0 评论 -
在自建的数据集上训练yolov3准备(三):数据集处理过程中可能用到的实用有效python小脚本(包括生成train.txt、随机重命名、随机裁剪、修改文本文档指定行列内容等)
前言 自己在网上下载的数据集,或者用自己采集的图片标注的图库亦或是用网上下载图片标注的图库,这些来源不一的数据有可能不能都满足要求,比如有的标注与图片是分开的,有的图片没有标注,或者标注数量大于图片,这些都要先进行一定的处理,我写了以下的小脚本来完成这些操作。准备cmd python3脚本 清除数据集中没有标注文件的图片。如果一幅图片没有标注,对于我...原创 2019-04-27 22:46:12 · 2277 阅读 · 2 评论 -
在自建的数据集上训练yolov3准备(四):将密集人头检测数据集brainwash标注转换成yolo标注,并用yolo_mark验证(附python脚本)
前言 项目中要用到人头的数据集,而在以前文章中的open image数据集中的人头大多没有俯拍图片,不太适合我的应用场景。一次偶然的机会,在guthubaditya-vora/FCHD-Fully-Convolutional-Head-Detector中发现了brainwash数据集。它的标注文件格式与yolo标注格式有很大的不同,本文旨在实现两者的转换。准备pyth...原创 2019-04-29 18:21:11 · 8684 阅读 · 45 评论