深度学习训练图片收集器——C++截图程序的实现1(需求分析篇)

本文介绍了在深度学习模型训练中,如何通过C++实现一个高效的截图程序,以自动化收集和处理训练图片。该程序避免了手动设置保存路径和二次处理的不便,适用于大量训练图片的收集,能自动分割字符和圈出物体,提高工作效率。
摘要由CSDN通过智能技术生成

当一个分类模型(例如车牌或人脸分类器)被设计出来后,设计者需要大量的数据对模型进行训练和验证,评估模型的好坏,不断地微调参数,以求达到最好的识别效果。

在这一环节中,大量的训练数据是必不可少的。

在学习过程中,我们可以通过百度和谷歌搜索到一些现成的数据集。但是,在实际项目中,很多情况下,难以直接获得现有的数据集,需要自己去独立获取和标注。

另外,别人的同类数据集也不一定适合你的算法和模型。

因此,很多时候需要自己去收集训练图片。

这时候就需要用到截图功能。

提到截图,相信大家用得最多的应该是QQ或微信的截图功能。

QQ和微信的截图虽然方便,但是不适合作为训练图片收集器,原因有二:一是截完图后需要手动设置保存路径和文件名;二是无法自动进行二次处理,例如,自动分割字符,自动圈出物体。鉴于这两点原因,对于几千上万张训练图片的收集任务,如果使用QQ或微信来辅助完成,其涉及到的人工操作量是一般人难以接受的。

因此,有必要实现一个独立的截图程序。

截图程序的操作思路如下:用户按下Alt+A组合键,进入截屏界面,用户用鼠标拖拽出截图区域矩形,双击鼠标右键,触发截图事件,程序对截图矩形所包围的图像进行二次处理,然后把处理结果保存到指定的目录(自动生成文件名)。在这整个操作过程中,用户只需要按Alt+A,选择截图区域,双击鼠标。相比使用QQ和微信,至少可以节省一半以上的工作量(虽然人工标注的工作量还是省不了的)。

现在我们先来看下程序的运行效

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值