专注Python、AI、大数据 @七步编程
本期内容
图片和PDF是我们日常学习和工作过程中接触较多的文件存储方式,它的确对数据的传输和内容的安全性带来了便利,但是,也为内容使用带来了一定的麻烦--需要重复性的劳动。
每当我们需要PDF或者图片中的文字,用于编辑或者翻译时,这时候就开始让人头疼,暴力复制会引起很多格式的错乱,最终只能无奈的重新输入一遍。重新输入对于篇幅较小的可以考虑,但是对于内容较多的却让人望而却步。
随着这两年OCR(Optical Character Recognition,光学字符识别)技术的成熟,越来越多的人开始考虑利用OCR来解决上述问题。因此,OCR相关的工具如同雨后春笋一样,层出不穷。这里面不乏有非常实用的工具,但是,我更愿意用群魔乱舞来形容当下的OCR工具。
有一些工具曾经以免费出道,风靡一时,然后开始推出收费版,而免费版的就如同废弃品一样,让人惨不忍睹,比如之前风靡一时的天若OCR。
也有一些甚至不如天若OCR的工具,从一开始就变小的不堪入目,识别结果乱七八糟,稳定性非常差。
经过一段时间的试用和对比,我精挑细选出6款OCR工具,其中,包括2款网页端、2款PC端、2款手机端,总有一款适合你。
1/网页端OCR
ocr.space是一款值得大书特书,且真正惊艳到我的OCR工具,甚至可以说,有了ocr.space,后面的5款可以选择性的忽略。
目前大多数OCR工具都会受限于以下几个弊端,仅支持图片识别
免费次数有限
支持语