Python与office の python-docx

       最近在做一个用Python读取office系列文件的小型应用,说实话用Python对windows系统进行操作真的是一件痛苦的事情…
       尤其比较坑的是在Windows上,Python不支持mknod函数,这也就意味着你要创建一个非.txt文件的话你需要先创建一个.txt文件,再强制修改其后缀。
       现在来分享一下Python如何对word文件(.docx)进行读取?
       因为网上有很多用python创建.docx文件的方法了,这里就不多说,主要来讲讲对已有数据的.docx数据进行读取。首先必须说明的是,.docx其实把内容分得很细,一篇文章的并不是以段为单位的,而是以runs为单位的,即如果你一段文字中,前半部分加粗而后半部分未加粗,那么从段落读取字体属性(word.paragraphs[i].style.font,bold)就会变成None,我们必须进入到paragraphs的下一层进行读取,即word.paragraphs[i].runs[j].font,bold,才能读取到该段的某一部分文字是否加粗。
       我用的Python3.6,用到的包是python-docx 0.8.7 ,windows10系统, office需要2010及以上的版本。
       from docx import Document 将包导入
        word = Document(.docx文件路径)
        word.paragraphs[0].style.font.name 检测字体【paragraphs[0]即文章的第一段,但是由于段间距、段缩进、首行缩进等原因,len(word. paragraphs)会大于文章的段落数,这是因为出现了许多word.paragraphs[i].text为空的段

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值