OCR文字识别算法与搭建流程

应用场景:

• 通用类:识别任意图片中的文字
• 个性化:识别指定类型的图片文字。PS:票据识别,身份证识别,车牌识别

实现技术:

• 文字区域检测(检测文字所在区域)
• 文字单体切割(对检测到的区域进行文字切割)
• 单体文字分类

正负样本:

在文字切割中需要用到的样本。
正样本为包含完整文本的图像。
负样本为不包含完成文本的图像。(无文本或残缺文本的图像)

文字分类器样本扩充:

• 每个字符加上随机背景。
• 对文字进行扭曲。
• 加入噪声。(效果微乎其微)

滑动窗口:

在文字切割过程中需要用到滑动窗口技术,窗口与文字等高,宽与文字等宽。
滑动窗口沿着行进行搜索,与正负样本进行比较。

实现流程:

  1. 首先训练模型能够在图片中检测出文字区域。
  2. 然后采用滑动窗口技术来切割单个文字区域。
  3. 训练单体文字分类器,完成单体文字的分类。
  4. 扩展识别区域,合并重叠区域,过滤掉纵横比不在阈值范围内的区域。
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

江小皮不皮

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值