抓取JPG和PDF上的文字
简单抓取PDF上的文字
大家或许有很多工具来抓取PDF上的文字,今天我想介绍大家一个简单有实惠的方法来抓取PDF文件上的文字.
首先打开PDF文件,然后选择打印,只要您系统上安装了Microsoft Office 2003的话,您将会有一个名字为Micosoft Office Document Image Writer可以选择,然后图片将打印到一个扩展名为MDI格式的图象文件.然后我们可以编辑这个文件,选择菜单工具中的"将文本发送到WORD",它将自动处理图象,将图象上的文字转换到WORD上.
让JPG上的文字转换到WORD中
在日常工作中,我们可能会遇到需要把扫描后的表格或文章再重新修改或排版,然而大家都知道,扫描后的文件格式是图片格式.一般情况下只有高档点的扫描仪可以直接选择扫描成PDF后者WORD格式.但是如果我们只有普通的扫描仪,而又要做到修改扫描后的文档,现在我就来教大家怎么在条件限制下,达到我们的目的.
首先我们要准备好OFFICE 2003,然后打开OFFCIE工具中的Micosoft Office Document Scanning工具,设置完后,我们就可以在需要修改的图片上右击,选择打印,然后一直下一步,知道选择打印机时,选择Micosoft Office Document Image Writer,然后将图片打印到文件扩展名为mdi格式的图片格式.打开后选择菜单工具中的"将文本发送到WORD".就是这么简单方便