本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。
引言
在日常生活里,不管是办公、学习还是制作邀请函、请柬、简历等等,我们都会使用一个软件Microsoft Office Word,Office Word是微软公司的一个收费文字处理应用程序,是最流行的文字处理程序之一,它虽功能强大,但简学易懂,但同时也有一个缺点,当一个Word文档储存的内容特别庞大的时候,使用者想要提取自己想要的表格内容,非常困难,需要使用特别多的步骤,非常繁琐,但是今天python能够解决其中的困难,是其变得非常简便。
问题描述
既然通过python提取word文档内容,这里需要了解一个python第三方库---python-docx库,docx库的基本用法详细查看官方文档: https://python-docx.readthedocs.org/en/latest/
在这里将要学习到的便是提取表格内容的具体步骤。
python-docx库的下载(Windows):pip install python-docx
python-docx模块是处理word的利器,希望通过调用模块生成预定格式的文件,word本身自带的模板使用不太方便,而日常学习