日常办公中,无论你是程序员还是普通文职人员,操作 Word 一定在你的工作中占了非常大的比例。项目文档、需求分析文档、合同报价、方案等等,这一系列都需要在 Word 中进行完成。但如何更高效灵活的使用 Word 你知道么?本小节将介绍 Python 第三方库 python-docx 模块完成对 Word 的操作。
1. python-docx 模块介绍
python-docx 是用于创建和更新 Microsoft Word(.docx)文件的 Python 库。
通过本小节的学习,我们最终要完成 Word 文档 “info.docx” 的创建,文档内容(花式 pick 慕课网)如下图所示。
1.1 安装
python-docx 是 Python 的第三方库,使用前需要通过以下命令进行安装:
pip install python-docx
1.2 使用步骤
步骤 1:导入 docx 模块
from docx import Document
步骤 2:创建(读取)一个文档对象
document = Document() # 新建文档对象 Document("info.docx") #读取现有的word 建立文档对象
步骤 3:向文档中写入内容
根据 docx 提供的方法,完成 Word 文档所需内容的写入。
步骤 4:生成 Excel 文件
from docx import Document document = Document() # 新建文档对象 ...省略部分代码 document.save('C:/info.docx')# 保存文档
通过 save () 方法进行保存,生成 Word 文件,save () 方法可以传入你想要保存到的文件路径。到这里就完成了新的 Word 文档创建和内容写入的操作。
2. python-docx 操作 Word 写入
接下来,针对 python-docx 提供的常用写入方法进行讲解,这里根据写入内容的类型进行划分。
2.1 写入文本
写入文本内容常用方法见下表。
方法名 | 描述 |
add_heading(text=u’’, level=1) | 写入标题段落 |
add_paragraph(text = u’’,style=None) | 写入普通段落 |
insert_paragraph_before(text = u’’,style=None) | 插入段落到现有段落之前 |
下面来具体看下每个方法的使用:
- add_heading () 使用:
from docx import Document document.add_heading('慕课网简介', level=1) document.save('info.docx')
代码解释:add_heading () 方法写入标题段落,段落样式由 level 决定,level 范围为 0 至 9,默认为 1。执行完成后,info.docx 文档效果如下图所示。
- add_paragraph () 使用:
from docx import Document document.add_heading('慕课网简介', level=1) p1 = document.add_paragraph( '慕课网是垂直的互联网IT技能免费学习网站。以独家视频教程、在线编程工具、学习计划、问答社区为核心特色。在这里,你可以找到最好的互联网技术牛人,也可以通过免费的在线公开视频课程学习国内领先的互联网IT技术') document.save('info.docx')
代码解释:add_paragraph () 方法写入段落,段落样式由 style 决定(本小节中仅写入段落,后续小节会对应用样式进行介绍),执行完成后,info.docx 文档效果如下图所示。
- insert_paragraph_before () 使用:
from docx import Document document.add_heading('慕课网简介', level=1) p1 = document.add_paragraph( '慕课网是垂直的互联网IT技能免费学习网站。以独家视频教程、在线编程工具、学习计划、问答社区为核心特色。在这里,你可以找到最好的互联网技术牛人,也可以通过免费的在线公开视频课程学习国内领先的互联网IT技术') p1.insert_paragraph_before('!!!慕课网是垂直的互联网IT技能免费学习网站') document.save('info.docx')
代码解释:insert_paragraph_before () 方法为插入段落到现有段落之前,段落样式由 style 决定。执行完成后,info.docx 文档效果如下图所示。
2.2 写入图片
写入图片方法,见下表。
方法 | 描述 |
add_picture(image_path_or_stream,width = None,height = None ) | 插入指定图片 |
对应代码中访问,如下所示:
from docx import Document from docx.shared import Pt document.add_heading('慕课网简介', level=1) ...省略部分代码 document.add_picture('logo.jpg') document.add_picture('logo.jpg', Pt(20), Pt(30)) document.save('info.docx')
代码解释:add_picture () 方法为插入指定图片,并根据宽度和高度缩放。如果未指定宽度或高度,则图片以其原始尺寸显示。代码中共插入了 2 张 logo 图片,第一张没有设置宽度和高度即按原始尺寸插入,第二张根据指定的宽度和高度按比例缩放,参数 Pt 为 points 磅,与字号对应可以参考下图。
执行完成后,info.docx 文档效果如下图所示。
2.3 写入表格
写入表格方法,见下表。
方法 | 描述 |
add_table(rows, cols) | 插入指定行数、列数的表格 |
通过表格可以很好的展示列表形式的数据,下面使用 add_table () 方法创建一个关于最新课程的表格,包含课程名称、讲师和价格。代码如下所示:
...省略部分代码 # 插入表格(1行3列,表格应用样式Medium List 2) table = document.add_table(rows=1, cols=3, style='Medium List 2') # 获取到第一行中的单元格列表 header_cells = table.rows[0].cells header_cells[0].text = '新上好课' header_cells[1].text = '讲师' header_cells[2].text = '价格' # 初始化课程数据 data = ( ['Java实操避坑指南', "勤一", 298], ['Vue2.5->2.6->3.0 开发去哪儿网APP', "DELL", 266], ['Vue3.0(正式版) TS 仿知乎专栏企业级项目', "张轩", 298], ) # 循环课程数据 for item in data: # 使用add_row()方法创建新的一行 rows_cells = table.add_row().cells rows_cells[0].text = item[0] rows_cells[1].text = item[1] rows_cells[2].text = str(item[2]) document.save('info.docx')
代码解释:add_table () 方法为插入指定行数、列数的表格,参数 rows 为指定行数,cols 为指定列数,style 为表格应用的样式。代码中初始表格为 1 行 3 列,在填充处理的位置,通过遍历调用 add_row () 方法添加新的一行,为其设置各单元格内容。执行完成后,info.docx 文档效果如下图所示。
3. 小结
本节课程我们主要学习了 python-docx 模块的使用。本节课程的重点如下:
- 了解 python-docx 模块作用及使用步骤;
- 掌握 python-docx 模块中写入文本、图片、表格的使用方法。
关于Python技术储备
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
对于0基础小白入门:
如果你是零基础小白,想快速入门Python是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案
包括:Python激活码+安装包、Python web开发,Python爬虫,Python数据分析,人工智能、机器学习等习教程。带你从零基础系统性的学好Python!
零基础Python学习资源介绍
👉Python学习路线汇总👈
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(全套教程文末领取哈)
👉Python必备开发工具👈
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉Python学习视频600合集👈
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉100道Python练习题👈
检查学习结果。