OCR文字识别算法与搭建流程

最新推荐文章于 2024-04-19 10:57:44 发布

江小皮不皮

最新推荐文章于 2024-04-19 10:57:44 发布

阅读量1.2k

点赞数 1

文章标签：算法深度学习计算机视觉 ocr 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq128252/article/details/116276341

版权

应用场景：

• 通用类：识别任意图片中的文字
• 个性化：识别指定类型的图片文字。PS:票据识别，身份证识别，车牌识别

实现技术：

• 文字区域检测（检测文字所在区域）
• 文字单体切割（对检测到的区域进行文字切割）
• 单体文字分类

正负样本：

在文字切割中需要用到的样本。
正样本为包含完整文本的图像。
负样本为不包含完成文本的图像。（无文本或残缺文本的图像）

文字分类器样本扩充：

• 每个字符加上随机背景。
• 对文字进行扭曲。
• 加入噪声。（效果微乎其微）

滑动窗口：

在文字切割过程中需要用到滑动窗口技术，窗口与文字等高，宽与文字等宽。
滑动窗口沿着行进行搜索，与正负样本进行比较。

实现流程：

首先训练模型能够在图片中检测出文字区域。
然后采用滑动窗口技术来切割单个文字区域。
训练单体文字分类器，完成单体文字的分类。
扩展识别区域，合并重叠区域，过滤掉纵横比不在阈值范围内的区域。

江小皮不皮

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
OCR文字识别算法与搭建流程

应用场景：• 通用类：识别任意图片中的文字• 个性化：识别指定类型的图片文字。PS:票据识别，身份证识别，车牌识别实现技术：• 文字区域检测（检测文字所在区域）• 文字单体切割（对检测到的区域进行文字切割）• 单体文字分类正负样本：在文字切割中需要用到的样本。正样本为包含完整文本的图像。负样本为不包含完成文本的图像。（无文本或残缺文本的图像）文字分类器样本扩充：• 每个字符加上随机背景。• 对文字进行扭曲。• 加入噪声。（效果微乎其微）滑动窗口：在文字切割过程中需要用到滑动窗
复制链接

扫一扫

江小皮不皮 CSDN认证博客专家 CSDN认证企业博客

码龄5年

87: 原创

23万+: 周排名

2万+: 总排名

39万+: 访问

: 等级

2105: 积分

662: 粉丝

856: 获赞

174: 评论

3736: 收藏

私信

关注

热门文章

最新评论

YOLOV5模型转onnx并推理
混子菜鸡一枚: 你好，请教一下。我用v5-lite直接训练自己的数据集得出来的pt权重，用export.py直接转onnx。然后onnx推理什么东西都检测不出来，这是为什么？pt权重在YOLO上是可以识别东西的
YOLOV5模型转onnx并推理
暴躁小李子: 博主 pt转为onnx之后置信度会下降吗
YOLOV5模型转onnx并推理
BellaOu: 你后来怎么解决的啊，哥
YOLOV5模型转onnx并推理
Cznorth: 你好，你的代码的draw函数里面top和left标反了
YOLOV5模型转onnx并推理
い不靠譜︶朱Sir: 谢谢哥，我也解决了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

江小皮不皮 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。