Python3-word文档操作(二):利用python获取word文档的内容

上一篇,学习了是用python的docx库创建一个word文档,并且编辑了标题和正文。本篇继续python操作word之旅:利用python来获取word文档的内容。

python脚本:

# -*- coding: utf-8 -*-
import os
import sys
import time
import docx
from docx.shared import RGBColor
from docx.shared import Pt

#提取word文档的内容
def fetch_doc():
    doc_name = "念奴娇_赤壁怀古.docx"
    doc = docx.Document(doc_name)
    title=doc.paragraphs[0] #获取标题

    for run in title.runs:
        print("run=",run)
        print(run.text)
    for paragraph in doc.paragraphs: #获取所有的paragraphs
        print("text==",paragraph.text)

if __name__ == '__main__':
    #create_doc()
    fetch_doc()

运行结果:

% python word_util.py

run= <docx.text.run.Run object at 0x10f157790>

念奴娇·赤壁怀古

text== 念奴娇·赤壁怀古

text== 大江东去,浪淘尽,千古风流人物。

故垒西边,人道是,三国周郎赤壁。

乱石穿空,惊涛拍岸,卷起千堆雪。

江山如画,一时多少豪杰。

遥想公瑾当年,小乔初嫁了,雄姿英发。

羽扇纶巾,谈笑间,樯橹灰飞烟灭。

故国神游,多情应笑我,早生华发。

人生如梦,一尊还酹江月。

说明:

docx.Document(doc_name):带参数的Document相当于获取一个已经存在的word文档;

doc.paragraphs:就是所有的 文档内容,包括标题;

paragraph.text:某一个内容的文本。


 

  • 0
    点赞
  • 5
    收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页
评论

打赏作者

liranke

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值