如何用java获取word文件的每个章节内容

引入Spire.doc.jar

直接官网下载jar或者引入maven依赖,这里我使用jar包的方式

读取章节内容的原理

先获取文档每一段的样式,判断样式是否为标题一,然后与下个标题一之间的内容全部读出来,循环读取。(如果word文档的每个章节都有分节符,直接使用getSections()方法即可,但是大多数文件都不会有分节符T_T)

代码示例

@Test
    public void readDoc() {
   
        Document doc = new Document();
//        doc.loadFromStream(new FileInputStream(new File("C:\\Users\\13404\\Desktop\\文本\\调研报告.doc")), FileFormat.Auto);
        doc.loadFromFile("C:\\Users\\13404\\Desktop\\可研\\可行性研究报告0123.doc");
        //遍历section,section为文件的小节,通过分节符来识别
        for (int i = 0; i < doc.getSections()
  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值