当你在网上下载了一个PDF文件,打开发现是扫描版的,无法直接复制、编辑里面的文字,该怎么办呢?
有人会选择对照PDF,手动一个一个字地输入,这种做法简直太蠢了,既浪费时间又浪费生命。聪明人会利用一些现成的OCR识别工具,将PDF文字提取出来,就可以自由地复制编辑啦!
那么问题来了:我们怎么识别图片文字、扫描版PDF呢?下面教你几种方法。
一、利用在线OCR识别工具
在线OCR识别工具的优点是无需安装、打开即用,比如下面这款「在线迅捷PDF转换器」,它不仅支持OCR,还支持文档格式转换、语音识别、在线PS等功能。
下面我们就对它的OCR识别工具做一个简要介绍:
1、图片局部识别
这个功能可以让你自由地选择图片识别区域,选完后网站会自动对图片文字进行识别,十分快捷。
2、图片OCR识别
如果整张图片的文字都需要识别,可以利用此功能直接将整张图片上