从零开始制作数据集所需要的所有python脚本

最新推荐文章于 2022-08-13 14:02:47 发布

墨麟非攻

最新推荐文章于 2022-08-13 14:02:47 发布

阅读量460

点赞数 2

分类专栏：深度学习文章标签：数据集的制作

本文链接：https://blog.csdn.net/qq_43452804/article/details/91490076

版权

最近一直在做图片数据集，积累了很多心得。我把我所使用的python脚本全部拿出来，当然这些脚本大部分网上都有，只不过比较分散。

我已经把所有代码上传到github上，觉得写的好的话，请给我一个star
Python-scripts-used-to-make-datasets
由于我的数据集是在拍摄路面的一些物体。因此分为视频和图片两种。视频分辨率1920x1080，帧率为60fps，图片分辨率为1920x1080。光拍摄图片比较慢，拍摄视频获取图片速度很快，毕竟可以将视频分解成帧，这样就可以在短时间内获取大量图片。顺便说一句，录制视频的时候可以缓慢的上下、左右移动镜头，这样得到的图片数据比较丰富。不是那种高度重复的

1. 视频分解为帧 video_to_picture.py

import cv2
vc = cv2.VideoCapture('E:/HDV-2019-5-8/Movie/20190508_0095.MP4') 
c=0
rval=vc.isOpened()
timeF = 30
while rval:   
    c = c + 1
    rval, frame = vc.read()
    if (c % timeF == 0):
        cv2.imwrite('E:/HDV-2019-5-8/digital_light/95/'+str(c).zfill(5) + '.jpg', frame)    
    cv2.waitKey(1)

vc.release()

其中 timeF 表示帧率，你也可以改小一点。一秒中获取2帧到4帧左右；zfill(5)：表示图片从00000~99999，数字的位数。如果视频很长，可以把5调大一点。

2. 手动删除不需要的图片

3. 按照VOC数据集的格式。详情请看我上篇博客:

在Ubuntu内制作自己的VOC数据集

4. 把所有图片放入JPEGImages文件中，后缀名一般为 .jpg .png .JPG。需要批量重命名文件夹中图片文件。使用rename.py

import os
class BatchRename():
    '''
    批量重命名文件夹中的图片文件
    '''
    def __init__(self):
        self.path = '/home/z/work/train'     #存放图片的文件夹路径
    def rename(self):
        filelist = os.listdir(self.path)
        total_num = len(filelist)
        i = 1
        for item in filelist:
            if item.endswith('.jpg') or item.endswith('.JPG'):  #图片格式为jpg、JPG
 
                src = os.path.join(os.path.abspath(self.path), item)
                dst = os.path.join(os.path.abspath(self.path), str(i).zfill(5) + '.jpg')      #设置新的图片名称
                try:
                    os.rename(src, dst)
                    print ("converting %s to %s ..." % (src, dst))
                    i = i + 1        
                except:
                    continue
 
        print ("tot

最低0.47元/天解锁文章

墨麟非攻

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
从零开始制作数据集所需要的所有python脚本

最近一直在做图片数据集，积累了很多心得。我把我所使用的python脚本全部拿出来，当然这些脚本大部分网上都有，只不过比较分散。我已经把所有代码上传到github上，觉得写的好的话，请给我一个starPython-scripts-used-to-make-datasets由于我的数据集是在拍摄路面的一些物体。因此分为视频和图片两种。视频分辨率1920x1080，帧率为60fps，图片分辨率为1...
复制链接

扫一扫