读取word文档结构图 word文档有多级标题(标题1,标题2,标题3.。。。。。。。)

读取word文档结构图  word文档有多级标题(标题1,标题2,标题3.。。。。。。。)

 

using System;
using System.Collections.Generic;
using System.Text;
using Microsoft.Office.Interop.Word;
namespace ConsoleApplication1
{
   
class Program
    {
       
static void Main(string[] args)
        {
           
for (int i = 0; i < 10; i++)
            {
                Microsoft.Office.Interop.Word.Application app
= new Microsoft.Office.Interop.Word.Application();
                Microsoft.Office.Interop.Word.Document doc
= null;
               
object fileName = "D://1.doc";
               
object unknow = Type.Missing;
              
                app.Visible
= true;
                doc
= app.Documents.Open(ref fileName,
                                            
ref unknow, ref unknow, ref unknow, ref unknow, ref unknow,
                                            
ref unknow, ref unknow, ref unknow, ref unknow, ref unknow,
                                            
ref unknow, ref unknow, ref unknow, ref unknow, ref unknow);
                Console.WriteLine(doc.Paragraphs[
1].Range.Text.Trim());

               
object unknowFirst = Type.Missing;
               
object saveChangesFirst = Microsoft.Office.Interop.Word.WdSaveOptions.wdPromptToSaveChanges;
                app.ActiveDocument.Close(
ref saveChangesFirst, ref unknowFirst, ref unknowFirst);

               
object unknowSec = Type.Missing;
               
object saveChanges = Microsoft.Office.Interop.Word.WdSaveOptions.wdSaveChanges;
                app.Quit(
ref saveChanges, ref unknowSec, ref unknowSec);
            }
        }
    }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
以下是使用Apache POI库来读取.doc和.docx文件的Java代码示例: ```java import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.usermodel.Paragraph; import org.apache.poi.hwpf.usermodel.Range; import org.apache.poi.openxml4j.exceptions.InvalidFormatException; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.apache.poi.xwpf.usermodel.XWPFParagraph; import org.apache.poi.xwpf.usermodel.XWPFStyles; public class WordReader { public static void main(String[] args) { try { // 读取doc文件 InputStream is = new FileInputStream("test.doc"); HWPFDocument doc = new HWPFDocument(is); Range range = doc.getRange(); for (int i = 0; i < range.numParagraphs(); i++) { Paragraph para = range.getParagraph(i); // 判断是否为标题 if (para.isInTable()) { continue; // 忽略表格中的标题 } if (para.getStyleIndex() == 0) { System.out.println("标题级别:" + 1); } else if (para.getStyleIndex() == 1) { System.out.println("标题级别:" + 2); } else if (para.getStyleIndex() == 2) { System.out.println("标题级别:" + 3); } else { continue; // 忽略非标题 } System.out.println("标题内容:" + para.text()); } is.close(); // 读取docx文件 is = new FileInputStream("test.docx"); XWPFDocument docx = new XWPFDocument(is); XWPFStyles styles = docx.getStyles(); for (XWPFParagraph para : docx.getParagraphs()) { // 判断是否为标题 String style = para.getStyle(); if (style != null && style.startsWith("Heading")) { int level = Integer.parseInt(style.substring(7)); System.out.println("标题级别:" + level); System.out.println("标题内容:" + para.getText()); } } is.close(); } catch (IOException e) { e.printStackTrace(); } catch (InvalidFormatException e) { e.printStackTrace(); } } } ``` 这段代码分别读取了一个.doc和一个.docx文件,并输出了文件中的所有标题的级别和文本内容。对于.doc文件,我们使用了HWPFDocument类来读取文档内容,对于.docx文件,我们使用了XWPFDocument类。在判断标题级别时,我们可以根据样式名称(对于.doc文件)或样式编号(对于.docx文件)来确定。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值