机器学习week 11笔记-吴恩达coursera 机器学习流水线pipeline与OCR

本文介绍了机器学习流水线pipeline在OCR中的应用,详细阐述了OCR流水线的工作原理,包括文字区域检测、字符分割和识别,并讨论了人工数据合成策略。此外,提到了上限分析在优化流程中的作用。最后,回顾了监督和无监督学习的基本算法及其应用场景。
摘要由CSDN通过智能技术生成

(最后一周,列举一下上课的重要知识点。)

一、机器学习流水线pipeline

1.1 photo OCR 图像识别

  • Optical Character Recognition光学文字识别,有三个主要特点:包括了多种机器学习的重要知识、涉及机器学习流水线、融合了计算机视觉CV和人工数据合成
  • OCR流水线-文字区域检测、字符分割、字符辨认

1.2 OCR流水线工作原理:滑动窗sliding windows

  • 固定宽高比的矩形,用于图像中人身影的检测
  • 文字区域检测:首先用神经网络模型训练数据,得到识别文字区域片段的参数,然后去确定目标数据的可能为文字区域
  • expansion扩展区域,抛弃宽高比例不对(正常文字区为宽>高)的区域,组合得到文字的最可能出现区域
  • 字符分割-同理,利用了 神经网络训练字符分割线的特征分类器

1.3 人工数据合成

  • 方式一:从头创造新数据,用其他资料粘贴上随机背景等方法创造新数据
  • 方式二:将数据(文字)进行弯曲等处理,从旧数据中获得新数据。
  • 增加数据的要求:已经为低偏差分类器,模型参数正常
  • 通过Crowd source众包系统可以获得新数据

1.4 Ceiling analysis上限分析

  • 做好单个过程
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值