OCR:使用数据生成工具对自己的文字识别数据进行生成

OCR:使用数据生成工具对自己的文字识别数据进行生成

参考

TextRecognitionDataGenerator

OCR数据集生成利器—TextRecognitionDataGenerator

python3-随机生成10位包含数字和字母的密码


1. 下载

我们在自己的目标文件夹打开终端cmd,执行下面代码

git clone git@github.com:Belval/TextRecognitionDataGenerator.git

然后我们进入trdg文件夹执行run.py可以进行数据生成

2. 认识自己数据

在这里可以看到自己的数据都是在金属表面进行点刻的字符,包括大写英文以及数字,并且数据居多。
在这里插入图片描述

3. 所要生成的数据

根据自己的数据,我们首先要明确两点:生成什么样label的数据,以及图片类型是什么样的?包括图片背景和数据颜色

3.1 生成label

强大的数据生成工具支持我们自己的label,而不用随机生成label。
这这里我自己写了一段代码,用于生成label的txt文件。
在这里我们生成20000个数据标签,其中的格式有
2个字母,11数字
3个字母,6个数字
6个数字
我们各生成7000个
在这里插入图片描述

import random,string
import argparse
import os
from tqdm import tqdm

parser = argparse.ArgumentParser(description="随机生成大写字母以及数字")
parser.add_argument(
        "--output_dir", type=str, nargs="?", help="The output directory", default="out/"
    )
parser.add_argument(
        "-n","--number_gener", type=int, nargs="?", help="how many number to gener", default="10"
    )
parser
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值