机器学习week 11笔记-吴恩达coursera 机器学习流水线pipeline与OCR

最新推荐文章于 2023-06-16 08:03:54 发布

独家*记忆

最新推荐文章于 2023-06-16 08:03:54 发布

阅读量365

点赞数 1

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43808279/article/details/116431654

版权

本文介绍了机器学习流水线pipeline在OCR中的应用，详细阐述了OCR流水线的工作原理，包括文字区域检测、字符分割和识别，并讨论了人工数据合成策略。此外，提到了上限分析在优化流程中的作用。最后，回顾了监督和无监督学习的基本算法及其应用场景。

摘要由CSDN通过智能技术生成

（最后一周，列举一下上课的重要知识点。）

一、机器学习流水线pipeline

1.1 photo OCR 图像识别

Optical Character Recognition光学文字识别，有三个主要特点：包括了多种机器学习的重要知识、涉及机器学习流水线、融合了计算机视觉CV和人工数据合成
OCR流水线-文字区域检测、字符分割、字符辨认

1.2 OCR流水线工作原理：滑动窗sliding windows

固定宽高比的矩形，用于图像中人身影的检测
文字区域检测：首先用神经网络模型训练数据，得到识别文字区域片段的参数，然后去确定目标数据的可能为文字区域
expansion扩展区域，抛弃宽高比例不对（正常文字区为宽>高）的区域，组合得到文字的最可能出现区域
字符分割-同理，利用了神经网络训练字符分割线的特征分类器

1.3 人工数据合成

方式一：从头创造新数据，用其他资料粘贴上随机背景等方法创造新数据
方式二：将数据（文字）进行弯曲等处理，从旧数据中获得新数据。
增加数据的要求：已经为低偏差分类器，模型参数正常
通过Crowd source众包系统可以获得新数据

1.4 Ceiling analysis上限分析

做好单个过程

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。