本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。
问题描述
如何使用python判断Word文档中的段落格式以及目录格式。
算法描述
本次主题与以往不同,重心不在算法上,而是实际操作上。要求很简单,python的一个程序应用,但想要实现还需要大量功夫,既然是使用python判断就需要到数据库,这里我使用的是python-docx的数据库,但在用代码实现过程中,还没有进行到判断就无法找出段前段后的距离,开始以为是文档地址不对,但是换了一个之后得到的段前简洁还是找不到,有可能是我的代码不够完整,获取的内容与操作内容无关,因为是在使用数据库的情况下进行实现的,那么换一种数据库可能就能够实现。说回实现,我们的目的是判断段前段后的距离是否为我们所要的给定数值,同时还是在一级标题内判断,意思就是仅仅=限于目录中的一级标题,就还要确定一级标题。如何判断,应该可以用到for循环和if的条件判断,判断出来的结果也只有满足与不满足,但是遍历的是整个目录,找出一级标题后再进行一次遍历,然后就判断是否一致。对于本次研究的重点就是这3个方面,每一步的代码实现我还需要更多时间学习,但是只要实现了每一过