如何将word图片上的文字提取出来

肯定有几个朋友有这种抓图上字的需求。很多软件要么识别率低,要么不好用。你可能没发现,word其实是一个抓词软件,识别率很高,很好用。关于这个软件的使用,这里有一个很好的图文教程。让我们来看看。后面还提供了一个在线工具。

  1.  通过在线工具提取

把word图片保存到电脑上,在浏览器搜索网站“信风工具网”,选择“图片转文字OCR”功能,点击“添加图片”按钮将图片上传,平台支持批量上传图片进行处理哦。

在线工具连接 https://ocr.bytedance.zj.cn/image/ImageText

2. 通过word工具

1打开word2016

2新建一个空白页

3选择右上角的”插入“栏下的”图片选项“

4将需要识别的图片插入到空白页

5选中图片,并点击左上角的图片转文字

6将会弹出”金山OCR文字识别“

7选择”从图片中读取“,找到你需要被读取的文件

8选择”保存为word“

9图片上的文字就转化为word文档信息了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
如果你需要提取Word文档中的图片文字,你可以使用Apache POI库和Apache Tika库的结合。 以下是一个简单的示例代码: ```java import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.util.List; import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.usermodel.Picture; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.tika.parser.AutoDetectParser; import org.apache.tika.parser.Parser; import org.apache.tika.sax.BodyContentHandler; public class ExtractWord { public static void main(String[] args) { try { FileInputStream fis = new FileInputStream("document.docx"); Parser parser = new AutoDetectParser(); BodyContentHandler handler = new BodyContentHandler(); parser.parse(fis, handler); String text = handler.toString(); System.out.println(text); fis.close(); XWPFDocument document = new XWPFDocument(new FileInputStream("document.docx")); List<XWPFPictureData> pictures = document.getAllPictures(); for (XWPFPictureData picture : pictures) { byte[] data = picture.getData(); FileOutputStream fos = new FileOutputStream(new File(picture.getFileName())); fos.write(data); fos.close(); } } catch (Exception ex) { ex.printStackTrace(); } } } ``` 在这个示例中,我们首先使用`AutoDetectParser`类来自动检测Word文档的格式,并使用`BodyContentHandler`类来提取文本内容和样式。如果你的Word文档中包含图片,我们使用`XWPFDocument`类来读取Word文档,并使用`getAllPictures()`方法来获取所有的图片数据,然后将图片数据写入到文件中。如果你的Word文档是`.doc`格式的,可以使用`HWPFDocument`类来读取Word文档,并使用`getPicturesTable().getAllPictures()`方法来获取所有的图片数据。 请注意,在使用`getAllPictures()`方法获取图片数据时,需要在代码中处理异常情况。另外,对于大型的Word文档,提取图片文字可能需要一些时间。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值