转自知乎:https://zhuanlan.zhihu.com/p/54156009
原文标题:识文精灵(ocrwiz):如何把在线文字识别(图片转文字)OCR的互动体验提升到极致
截图——>粘贴图片(Ctrl+V)——>拷贝结果(Ctrl+C),只需要几秒钟,就可以快速识别并得到图片中的文字,体验行云流水、指哪打哪的感觉,这就是识文精灵(OcrWiz)给大家带来的体验,希望能给大家带来方便。
缘起
我学习的时候有做笔记的习惯,看到好的文章除了收藏保存,关键段落经常摘抄到word文档中,便于今后归纳整理。拷贝粘贴(Ctrl+C, Ctrl+V),是最经常做的操作。但遗憾的是,现在很多网站做了保护措施,文字不能正常拷贝,或者直接就是图片,要摘抄就只能截图,感觉很不方便。好在人工智能技术发展迅猛,OCR识别准确率也越来越高,可以直接从图片转换为文字,这就为做笔记开了方便之门。
上网搜“在线文字识别”,可以查到很多OCR服务。但可惜的是,绝大部分提供的输入方式是“上传文件”。标准流程是:先截图,保存为本地文件,然后再从网页选择”上传文件”,找到保存截图的文件夹,才能开始识别。找文件还要层层点开目录树,不胜繁琐。好不容易识别出结果了,拷贝到剪贴板,往word里粘贴,突然发现,每行都加了换行符,格式往往很难看。只好手工逐个删除换行。如此一番折腾,一次简单的文字识别任务,往往要花好几分钟才能完成,这哪里是互联网的效率?最困难的识别任务都做好了,但是这“最后一公里”的交互任务,却太难用了!实在找不到现成的,就自己写一个吧!
识文精灵(OcrWiz)是什么
识文精灵(OcrWiz)是一款在线文字识别云服务,致力于解决文字识别的交互效率问题,将交互体验提升到极致。本服务的交互方式针对PC设计,目前暂时不适合手机等移动终端使用。
使用前有哪些准备工作
为了更好的使用本服务,请提前安装自己习惯使用的截图软件。强烈推荐微信网页版。安装完毕,登录以后,按热键“ Alt+A ”,可以截取屏幕上任何区域的文字,非常好用。
识文精灵的正确打开方式
主要流程就三步:
- 如果安装了微信PC版,直接按Alt+A键,在屏幕上截取感兴趣的文字内容。如果已经保存了本地图片,也可以直接用图片软件打开,把图片内容拷贝到剪贴板;
- 打开浏览器,进入"识文精灵"http://ocrwiz.com;直接按Ctrl+V键,把剪贴板图片内容粘贴到页面“待识别图片”区域,系统同时也在后台上传图片到服务器,并自动进行OCR识别;
- 如果识别成功,在页面“已识别文字”区域会出现识别结果,请点按“复制结果”按钮,把已识别的文字复制到剪贴板。
动作快的话,三秒钟完成!!!
识别结果如何去除换行
默认情况下,系统会把所有的换行符都自动去掉。这个设计比较适合于大段文字的识别,节约了大量整理换行符的时间。但是,也有很多情况需要保留换行符,为此,在识别结果的每行文字前都有一个选择框,选中表示在此行前面一行(注意不是本行末尾,而是前面一行的末尾)加入换行符。
另外,在区域左上角有一个总的选择框“本行文字前加换行”,它可以控制所有各行全部加换行,还是去掉换行。通过这个总开关,结合各行前的选择框,就可以灵活控制识别结果中的换行效果了。最终结果,以各行前的选择框为准。
如何调整界面布局便于校对
图像识别完成以后,我们往往要校对一下,比较识别结果是不是准确。目前对页面布局进行了一些设计,便于核对,包括以下三个方面:
- 在页面“待识别图片”区域设置了三个按钮,用来调整图片的显示效果,分别是:图片宽度与窗口对齐;图片高度与窗口对齐;保持图片原始大小。如果超出了窗口大小在,则自动出现滚动条。图片比例尽量保持不变;
- 在页面“已识别文字”区域设置了三个按钮,用来调整文字的大小。分别是:放大文字;缩小文字;恢复默认大小。默认字体高度是12像素,最大不能超过60像素,最小不少于3像素;
- 在页面导航区有一个“布局”区域,用于设置图像区和文字区的布局样式,包括三个模式:
- 自动;安装输入图片的大小系统自动指定上下模式还是左右模式;
- 左右:固定显示为左右模式;
- 上下:固定显示为上下模式。
展示效果:
- 左右布局
- 上下布局
其他说明
目前这个服务是免费的,如果访问缓慢,一般是使用的人比较多,服务器带宽不够导致。敬请大家谅解!访问地址是:http://ocrwiz.com