虽然pdf文档在诺基亚E61上能看,不过,扫描的图片的pdf缩放貌似不管用,放大1000%还是看不清楚。
以下是我尝试把pdf转换为txt的过程:
1,扫描的pdf不能直接用转换工具转换为txt的,必须OCR识别
2,把pdf打印为mdi文件,用Microsoft Office Document Imaging打开之后不能进行文字识别,扫描后的文字质量比较低,Microsoft Office Document Imaging根本无法识别。
3,CAJViewer识别,识别效果非常好,不过只能选中一段文字识别,如果是整个文档另存为txt全部是乱码。
4,我最后的解决方法是,用“PDF2JPG”工具把pdf转换为jpg,然后使用“尚书七号OCR”识别图片文字。(因为尚书七号OCR不能直接打开pdf)。识别效果还可以接受,90%以上。
希望可能找到更好的解决方法。