水表数字识别1:水表数字数据集说明(含下载链接)
目录
1.前言
本项目将实现水表数字识别,整套方案采用二阶段方法实现,即首先使用文本(数字)检测模型DBNet定位水表数字的区域,然后进行校正并裁剪水表数字区域,再使用CRNN模型对水表数字的区域进行文本(数字)识别。
整套项目分为:数据集说明,DBNet文本(数字)检测模型训练、CRNN文本(数字)识别模型训练,以及水表数字识别边缘侧部署C++/Android等多个章节,本篇是项目《水表数字识别》系列文章之《水表数字数据集说明》;为了方便后续模型工程化和Android平台部署,项目对文字检测模型和文字识别模型进行轻量化,并提供Python/C++/Android多个版本;
本篇主要分享水表数字数据集:Water-Meter-Det1和Water-Meter-Det2,总数约6000+张图片,主要用于水表数字检测模型或分割模型训练和开发;Water-Meter-Rec1和Water-Meter-Rec2,总数约12000+张图片,主要用于水表数字识别模型训练和开发:
【尊重原创,转载请注明出处】https://blog.csdn.net/guyuealian/article/details/139997366
更多项目《水表数字识别》系列文章请参考:
- 水表数字识别1:水表数字数据集说明(含下载链接)
- 水表数字识别2:Pytorch DBNet实现水表数字检测(含训练代码和数据集)
- 水表数字识别3:Pytorch CRNN实现水表数字识别(含训练代码和数据集)
- 水表数字识别4:C++实现水表数字识别(含源码 可实时检测)
- 水表数字识别5:Android实现水表数字识别(含源码 可实时检测)
2.水表数字数据集说明
(1)水表数字检测数据集:Water-Meter-Det1
Water-Meter-Det1数据集是水表数字检测/分割数据集,图片数据主要来源网上收集并人工清洗获得,图片质量较好,目标比较清晰;所有图片均使用Labelme工具进行人工标注了水表数字区域的轮廓以及对应的表显数值,标注数据格式即是Labelme的默认格式。该数据集,包含训练集train和测试集val两个数据集,其中train训练集共有800张图片,val测试集共有200张图片,可用于水表数字检测模型和分割模型训练和开发。
如果你想使用Labelme工具查看标注效果,可以将json文件放在image同一个文件夹中,然后使用Labelme打开该目录,即可查看标注效果。
(2)水表数字检测数据集:Water-Meter-Det2
Water-Meter-Det2数据集是水表数字检测/分割数据集,仅包含训练集train,共有5742张图片,图片数据主要来源网上收集,数据样式较多,包含多种水表款式,多种角度拍摄,多种复杂背景,部分图片比较模糊,所有图片均使用Labelme工具进行人工标注了水表数字区域的轮廓以及对应的表显数值,标注数据格式即是Labelme的默认格式。该数据集,可用于水表数字检测模型和分割模型训练和开发。
如果你想使用Labelme工具查看标注效果,可以将json文件放在image同一个文件夹中,然后使用Labelme打开该目录,即可查看标注效果。
(3)水表数字识别数据集:Water-Meter-Rec1
Water-Meter-Rec1是在Water-Meter-Det1数据集上裁剪和扩充,并进行透视变换矫正的水表数字区域图片。该数据集,包含训练集train和测试集val两个数据集,其中train训练集共有1600张图片,val测试集共有400张图片,可用于水表数字识别模型训练和开发。
- 对水表数字区域进行裁剪时,需要进行透视变换矫正,以矫正倾斜的图片,裁剪时请尽量保证数字的完整性,其他非数字区域尽量去除
- 强烈建议对水表进行倾斜校正,避免倾斜带来的影响;本项目已经实现水表数字区域的倾斜校正,具体方法请参考:Python OpenCV实现文档自动矫正(含源码和测试数据)
- 一张图片仅包含一个水表,不能出现多个水表
- 水表数字图片文件命名规则:水表数字_序号ID ;如【007225_image_000.jpg】,其中【007225】表示这个张图片的真实数字,【image_000】是序号ID,这个序号ID是为了避免水表数字重复,序号ID可以是任意字符;模型训练时,仅取水表数字作为label进行训练,序号ID会被忽略。
如果,你需要新增自己的水表数字识别数据集,请按照上面的要求制作即可
(4)水表数字识别数据集:Water-Meter-Rec2
Water-Meter-Rec2是在Water-Meter-Det2数据集上裁剪和扩充,并进行透视变换矫正的水表数字区域图片。该数据集,仅包含训练集train,共有11436张图片,可用于水表数字识别模型训练和开发。
3.数据集下载
【源码下载】GitCode,关键词【水表数字数据集】
项目资源内容包含:
- 水表数字检测数据集:Water-Meter-Det1,train训练集共有800张图片,val测试集共有200张图片,可用于水表数字检测模型和分割模型训练和开发。
- 水表数字检测数据集:Water-Meter-Det2,仅包含训练集train,共有5742张图片,可用于水表数字检测模型和分割模型训练和开发。
- 水表数字识别数据集:Water-Meter-Rec1,train训练集共有1600张图片,val测试集共有400张图片,可用于水表数字识别模型训练和开发
- 水表数字识别数据集:Water-Meter-Rec2,仅包含训练集train,共有11436张图片,可用于水表数字识别模型训练和开发。
4.水表数字识别(Python/C++/Android)
水表数字识别Android APP Demo体验:https://download.csdn.net/download/guyuealian/89537381