利用R语言实现OCR的笔记

一、OCR能干什么

OCR(Optical Character Recognition)能够实现对文本资料的图像文件进行分析识别处理,获取文字及版面信息,这意味着面对大篇幅显示为.jpg、.png等图片的文字信息,我们不需要手动录入就可以实现将图片转化为文本

前段时间笔者看到复旦大学有位博士利用OCR将核酸检测图片的信息转化为文本并进行整理。笔者最近恰好在学习R语言,想到R语言对于表格类的信息处理起来具有天然的优势,于是决定尝试用R语言实现这一过程。

经过笔者在CSDN、腾讯云和哔站等社区的学习,目前可以实现部分该功能,遂做记录,后续会逐步完善

二、R环境下实现OCR的功能的包

鉴于R环境下存在各种R包对R的工作环境进行不断的扩充,笔者觉得应该存在一个R包能够实现OCR功能。经过查找,这个包也确实存在。

tesseract包即可实现OCR功能

事实上,tesseract本身就是一个支持多种操作系统的OCR引擎。tesseract的最大优点是它是一个开源软件。在2006年tesseract被认为是最精准的开源光学字符识别引擎之一。(上述资料来源于维基百科)

在这篇blog中,笔者将实现在R环境下OCR中文图片输出文本文件并简单测试tesseract包进行OCR的性能

三、R环境下实现OCR

1.R包准备

#初始化
rm(list = ls()) 
options(stringsAsFactors = F)

#R包加载
library(magick) #图片切割
library(tesseract)#ocr文字识别
library(stringr)#字符串处理
library(httr)#处理http信息

本次用到的R包如果没有安装都可以通过install.packages()安装成功

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值