猫儿我最近工作遇到了万恶的格式转换问题PDF-Word。众位看官抢着说“这不是很简单嘛?”“你就用XX软件就可以了嘛!”事实果真如此么?今天准备了10款软件和1份PDF文档进行测评。
1.ABBYY FineReader11
一个知名的俄罗斯ORC软件,拥有高超的识别技术。
OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。——百度百科
好我们下面就用ABBYY进行识别~
也许是安装的问题,使用ABBYY任务页中的PDF-Word并无任何输出。只好使用另存为试试。识别效果如下:(左:PDF原件;右:识别生成件,下同)
发现生成后的字体有些奇怪有木有!不过只要换换字体,对不能识别的部分稍做编辑还是很好用的。
再来看看ABBYY转换扫描图像件的表现:
非常完美有木有!只需换字体,轻松可编辑。
综合打分:★★★★★
2.Adobe Acrobat XI Pro
提起Adobe公司详细你一定不会陌生,Acrobat就是该公司旗下的重要PDF处理软件。因为完全激活的步骤太繁琐,在此只装了试用版,转换效果如下:
可以看出识别率与ABBYY不分伯仲甚至略好于ABBYY,转换后的字体也保持本色,稍加编辑便可完成转换工作。
如图所示,转换后的表格文字识别率不高。
打分:★★★★
3.VeryPDF2Word
一款英文软件。为提高测评效率不注册在此只试用。
识别率不高,字体也出现了变形,然而小巧的体积和傻瓜式的操作还是让VeryPDF2Word成为一款实用的软件。
再看看它对扫描图像件的识别率:
第二行中的表格经过转换后不能编辑,而是变为存储在Word文件中的图片。明显可见,VeryPDF并不适用于扫描图像件的识别。
综合打分:★★★
4.CAJViewer 7.2
又是一款重量级软件,安装后会生成个人图书馆的图标,只需注册便可以遨游电子图书世界。(我猜的,懒得注册= =#)该款软件只支持将全文或选区内文本存为txt格式,所以实用性相对差了一点。以下是转换前后对比图:
我们发现,识别率不高,错别字很多。而且很关键的是CAJViewer无法识别图像,所以综合考虑,还是电子资料的收集和阅览更适合它。
综合打分:★★★
5.Solid Converter PDF v6
使用该软件只能将PDF转换为Word中的图片。
鉴于它还有很多功能(见上图),姑且将其列为实用软件之一。
综合打分:★★★
6.福昕阅读器
虽然该软件不擅长格式转换(只能将PDF文件转为乱码横行的txt),依然要在此推荐它。因为福昕阅读器自带的打字机功能使之可以直接编辑PDF文件,是遇到填写PDF表格任务的工作者们的福音。
综合打分:★★★★
以上便是本猫对PDF-Word转换的一些经验,性能重复的软件在此没有列出,希望能对有需求的普罗大众有所帮助,减少软件筛选的时间~由于电脑莫名的设置问题,汉王OCR在此无法展示,想要探索的同学试试XP下的汉王文豪7600吧!也许会给你惊喜: )
--------------------以下内容为更新1.0-------------------------
7.汉王OCR
安装快捷,傻瓜操作,无奈只擅长纯文字的图像(PDF)转换。以下为效果:
可见汉王OCR对文字识别除了偶尔的错字外,转换效果还是比较好的。
转换表格时发生的问题:图文重叠,表格框线无法识别:
综合打分:★★★