Python
文章平均质量分 60
肺叶回收站
这个作者很懒,什么都没留下…
展开
-
数据集处理(三)——打乱数据集
1 个目录问题描述解决思路完整代码二级目录三级目录问题描述目前已有的数据集包括网上已有的数据集和线下拍摄的数据集,需要进行汇总。同时,为了加强模型的泛化能力,需要打乱数据集。解决思路已有的数据集包括42088个文件resultList = [] # 用于存放结果的ListA = 50000000 # 最小随机数B = 50042088 # 最大随机数COUNT = 42088# 利用Python中的randomw.sample()函数实现resultList = random.sa原创 2021-03-18 19:25:39 · 1888 阅读 · 0 评论 -
数据集处理(一)——对视频抽取若干帧
*完整代码请滑到文章末尾。1 个目录一、问题描述二、解决方案1.获取视频长度2.判断分割帧数三、完整代码一、问题描述针对大量视频文件,每个视频抽取30~40帧。二、解决方案针对上述问题,可以获取视频的长度,根据视频长度判断一秒分割成多少帧。1.获取视频长度一开始找到了通过moviepy库1,具体代码如下:from moviepy.editor import VideoFileClipdef get_video_times(video_path): video_clip = V.原创 2021-03-18 05:46:43 · 1601 阅读 · 0 评论 -
数据集处理(二)——对视频帧进行随机数据增强
目录问题描述心路历程问题的解决效果的选择解决方案我问题描述现有若干个视频,视频被分割成若干帧,需要对视频帧进行随机数据增强。心路历程问题的解决参考了这篇博客(link),但是同一视频中的不同帧数据增强效果不同,不符合实际意图。参考带标签的图像增强方法(link),在增强同个视频的不同帧时,利用seq.to_deterministic()得到确定的增强函数,从而解决问题。修改之后,程序单独增强每帧图片,而非增强一个batchs,运行的速度比较慢。可以考虑调用多核CPU(link)效果的选择(原创 2021-03-17 15:57:13 · 1811 阅读 · 0 评论