十八、照片OCR和机器学习流水线

1、照片OCR

\qquad 照片OCR(Optical Character Recognition)也称照片光学字符识别,照片OCR的流程包含以下三步:第一步是文本检测;第二步是字符分割;最后一步是字符分类;如下图所示:
在这里插入图片描述
\qquad 像上述这种系统,称之为机器学习流水线,指一个系统中包含许多阶段和组成部分,其中某些组成部分之中需要用到机器学习的内容。

1.1 滑动窗口分类器(Sliding Windows Classifier)

\qquad 对于一幅图片,首先选择一个矩形框作为image patch,之后选定一个步长e.g., 4 pixels,然后让矩形框按照步长向前移动,直到搜索完整幅图片的所有像素。
在这里插入图片描述

1.2 获取大量训练数据-人工合成数据

\qquad 人工合成数据有两种方式,一种是从无到有合成数据,另外一种是通过对已有的训练数据进行一定的变换进行数据集扩大。
在这里插入图片描述
\qquad 注意事项: 首先确保模型有比较小的bias值,这样扩大训练集数据才有意义;增加特征数量和神经网络中隐藏层的数量都可以增大bias值。

1.3 上限分析-ceiling analysis

\qquad 上限分析是用来判断在机器学习的整个框架之中,哪一个部分最值得花时间取提升效能。上限分析的基本思想是,手动将机器学习流水线中的每一部分设置为完全准确的分类效果,之后沿着流水线向下依次调整,调整一次之后记录调整之后的分类准确率的变化,最终将分类准确率变化最大的那个模块挑出来,即为最值得改进的模块。
在这里插入图片描述

THE END

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
使用Python进行OCR(光学字符识别)可以借助一些库和工具来实现。其中,cnocr和pytesseract是两个常用的库。 cnocr是一个基于深度学习的中文OCR库,可以用于识别中文字符。使用cnocr进行OCR的代码示例如下: ```python from cnocr import CnOcr ocr = CnOcr() res = ocr.ocr('test.png') print("Predicted Chars:", res) ``` 这段代码使用cnocr库加载模型,并对名为test.png的图片进行OCR识别,然后打印出识别结果。 另一个常用的OCR库是pytesseract,它是Tesseract OCR的Python接口。使用pytesseract进行OCR的代码示例如下: ```python import pytesseract from PIL import Image text = pytesseract.image_to_string(Image.open("D:\\test.png"), lang="eng") print(text) ``` 这段代码使用pytesseract库将名为test.png的图片转换为文本,并打印出识别结果。如果你想尝试识别中文,只需将代码中的lang参数改为"chi_sim"即可。 在使用pytesseract之前,你需要先安装Tesseract OCR和Pillow库。你可以使用pip命令来安装pytesseract和Pillow: ``` pip install pytesseract pip install pillow ``` 另外,你还需要下载并安装Tesseract OCR引擎,并将其路径配置到pytesseract中。以上代码示例中的`tesseract_cmd`变量就是用来指定Tesseract OCR引擎的路径。 希望这些信息对你有帮助! #### 引用[.reference_title] - *1* *2* *3* [python之OCR文字识别](https://blog.csdn.net/wu_zhiyuan/article/details/125412990)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Dragon Fly

多谢老板赏钱[抱拳抱拳抱拳]

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值