机器学习（第十一周）--图片OCR算法

最新推荐文章于 2024-05-14 16:12:08 发布

昌李

最新推荐文章于 2024-05-14 16:12:08 发布

阅读量1.7w

点赞数 3

分类专栏：机器学习课程回顾文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liyanchang567/article/details/80765335

版权

机器学习课程回顾专栏收录该内容

14 篇文章 1 订阅

订阅专栏

OCR识别文字流程：

1、识别出文字区域（通过滑动窗口算法，遍历整个图片，有监督的标记训练样本特征进行判断，找到目标图片进行矩形化摘取出来）

2、对文字区域矩形分割，拆分成不同的字符(在矩形中做一维滑动窗口移动，判断字符间间距，对字符进行划分)

3、字符分类（对划分好的字符根据监督算法，对字符进行预测）

4、识别出来文字（最终识别出整个字符）

整个流程由多个任务的构成

流程图如下：

举例如下：

通过学习曲线判断分类算法属于低偏差的算法类型，如果不是通过特征向量修正或者增加神经网络隐藏层的方式进行修正。地偏差算法可以通过增加训练样本集的方式提高算法结果

扩大样本训练集的方式

1、把已有的结果经过一定的扭曲获得新的样本（使用已有的数据包，添加不同的背景信息获得标记样本）；

2、自己标记或者收集样本信息

3、通过众包的方式，找到廉价的方式标记样本

上限分析

在整个开发算法过程中做上限分析可以让我们明白那些环节应该花费更多的精力优化，才能提升效果

系统整体性能是通过手动分类的结果，直接公布算法的标准答案

每个环节分别提升的效率是通过手工完成之后算法提升的效果，改善该环节之后算法预测的准确率

每个环节的提升的上限均知道之后，就可以明白那些环节提升之后能够更大程度提高系统的优化性能

举例如下：

本课程的总结：

关注

3
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
机器学习（第十一周）--图片OCR算法

OCR识别文字流程：1、识别出文字区域（通过滑动窗口算法，遍历整个图片，有监督的标记训练样本特征进行判断，找到目标图片进行矩形化摘取出来）2、对文字区域矩形分割，拆分成不同的字符(在矩形中做一维滑动窗口移动，判断字符间间距，对字符进行划分)3、字符分类（对划分好的字符根据监督算法，对字符进行预测）4、识别出来文字（最终识别出整个字符）整个流程由多个任务的构成流程图如下：举例如下：通过学习曲线判断分...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。