一、基础内容
安装第三方库的时候安装:python-docx
from docx import Document
Pt - 像素、Cm - 厘米、Inches - 英寸
from docx.shared import Pt, Cm, Inches, RGBColor
1. 基本概念
1)Document对象(文档对象) - 代表一个word文件
2)heading(标题)
3)paragraph(段落) - 一段文字
4) run - 多个run可以拼成一个段落,不同的run可以单独设置不同的样式
5)table(表格) - 多行多列的表格
6)picture(图片) - 文档中插入的图片
2. 操作word文档
1)创建空的word文档
doc = Document()
2) 添加标题
Document对象.add_heading(标题内容,level=1)
level的取值范围是:1 ~ 9,如果是0表示普通段落
h1 = doc.add_heading('数据分析报告', level=1) # 添加一个一级标题
3)添加段落
Document对象.add_paragraph(段落内容)
3.1)直接添加整个段落文字 ```python
p1 = doc.add_paragraph('此次调研数据主要通过问卷发放的形式获取,在紫金港全校范围内开展。样本数据通过简单随机抽样和分层抽样相结合的方法,进行相对广泛的数据采集与调研,选取的样本量较大,获得的数据客观真实。以下为具体的数据分析结果:')
h2 = doc.add_heading('一、总体情况', level=2)
##### 3.2)分段添加段落问题
段落对象.add_run(内容)
p2 = doc.add_paragraph('共发放问卷:')
run = p2.add_run('320 份')
run.font.color.rgb = RGBColor(255, 0, 0)
p3 = doc.add_paragraph()
run1 = p3.add_run('回收问卷: ')
run2 = p3.add_run('296 份')
run3 = p3.add_run(',回收率')
run4 = p3.add_run('92.5%')
添加分页(换页)
doc.add_page_break()
h3 = doc.add_heading('二、样本代表性', level=2)
h4 = doc.add_heading('(一)性别:分布', level=3)
4) 添加表格
Document对象.add_table(行数, 列数)
table = doc.add_table(3, 3, style="Light Grid") # 'Medium Grid'
table.cell(0, 0).text = '性别'
table.cell(0, 1).text = '人数'
table.cell(1, 0).text = '男'
5)添加图片
doc.add_paragraph()
如果添加图片的时候没有设置宽高,图片按照原图大小显示
doc.add_picture('files/img1.png', width=Cm(13))
doc.add_picture('files/liubei.jpg', width=Cm(13))
保存word文档
doc.save('files/demo1.docx')
二、单独设置内容样式
from docx import Document
from docx.shared import Pt, Cm, Inches, RGBColor
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
doc = Document()
1. 字体相关样式
1.1 标题相关样式
h1 = doc.add_heading(level=1)
run = h1.add_run('数据分析报告')
设置标题的字体大小
h1.style.font.size = Pt(25)
设置文字颜色
h1.style.font.color.rgb = RGBColor(97, 197, 84)
文字居中(CENTER、LEFT、RIGHT)
h1.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
设置字体名称(标题的字体名称不能直接设置到标题对象上的,需要设置到提供内容的run对象上)
run.font.name = '楷体'