在工作中偶尔会遇到老板给你三两页文件,说:做一份电子版的给我吧。看着麻麻的文字,真觉得有些小恐怖,一个字一个字的输入工作量不是一般的大,更主要的是很容易输入错字,别字!这两天我就遇到了这样一个问题,头给的是一个IT设备资产统计表,让做一个电子版的,那些资产的编号真是一个长呀,手动输入完而且没有错误,估计我们都进入到共产主义社会了!
        如果你的文档不是手写的,都是很工整的机器打印体,那你就幸福了。
幸福路线:纸质文档——扫描成图片——使用OCR识别软件,把图片里的文字识别出来导出到电子文档,再稍加编辑!
       “ OCR是光学字符识别(Optical Character Recognition),属于图型识别(Pattern Recognition,PR)的一门学问。现在OCR一般都是指文字识别OCR。是为了使汉字信息高速输入计算机,以解决低速的信息输入与高速信息处理之间的矛盾,从而提高整个计算机系统的效率,使人们从繁重的键盘录入汉字的劳动中解脱出来。只要把文本图像输入到计算机,就能通过OCR软件自动产生汉字文本文件,这与人手工键入的汉字效果是一样的,但速度比手工快几十倍”----引自 《赛酷文档秘书》官网
         我所用到的软件是尚书六号,乱码有些严重!同事说惠普也有一款OCR软件,可惜找不到!还有就是网友反应的赛酷文档秘书,没有用过!
         这是个人工作中一些所得,欢迎大家一块交流一下,为今后可能遇见的这种问题提出更好的解决方案!