扫描的图片PDF转换为txt

虽然pdf文档在诺基亚E61上能看,不过,扫描的图片的pdf缩放貌似不管用,放大1000%还是看不清楚。

以下是我尝试把pdf转换为txt的过程:

1,扫描的pdf不能直接用转换工具转换为txt的,必须OCR识别

2,把pdf打印为mdi文件,用Microsoft Office Document Imaging打开之后不能进行文字识别,扫描后的文字质量比较低,Microsoft Office Document Imaging根本无法识别。

3,CAJViewer识别,识别效果非常好,不过只能选中一段文字识别,如果是整个文档另存为txt全部是乱码。

4,我最后的解决方法是,用“PDF2JPG”工具把pdf转换为jpg,然后使用“尚书七号OCR”识别图片文字。(因为尚书七号OCR不能直接打开pdf)。识别效果还可以接受,90%以上。

 

希望可能找到更好的解决方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值