上节python办公自动化:自动打开word文档我们一起学会了在python里打开并保存一个word文档。这节我们将会学会如何利用python进行文本处理和将其在word里进行排版等技巧。
python进行文本处理和将其在word里进行排版等技巧
使用文本
要有效地处理文本,首先要了解一些块级元素(如段落)和内联级对象(如运行),这一点很重要。
块级与内联文本对象
该段落是Word中的主要块级对象。
块级项目在其左右边缘之间流动包含的文本,每次文本超出其右边界时添加一条附加行。对于段落,边界通常是页边距,但如果页面按列布局,它们也可以是列边界,如果段落出现在表格单元格内,则它们也可以是单元格边界。
表也是块级对象。
内联对象是在块级项目内发生的内容的一部分。一个例子是以粗体显示的单词或全部大写的句子。最常见的内联对象是运行。块容器中的所有内容都在内联对象内。通常,段落包含一个或多个运行,每个运行包含段落文本的某些部分。
块级项目的属性指定其在页面上的位置,例如段落前后的缩进和空格。内联项的属性通常指定内容显示的字体,如字体,字体大小,粗体和斜体。
段落属性
段落具有各种属性,用于指定其在容器(通常是页面)中的位置以及将其内容划分为单独行的方式。
通常,最好定义将这些属性收集到有意义的组中的段落样式,并将适当的样式应用于每个段落,而不是将这些属性直接重复应用于每个段落。这类似于层叠样式表(CSS)如何与HTML一起使用。此处描述的所有段落属性都可以使用样式设置,也可以直接应用于段落。
使用段落属性可用的对象 访问段落的格式属性 。
水平对齐(对齐)
也称为对齐,可以使用枚举值将段落的水平对齐设置为左对齐,居中对齐,右对齐或完全对齐(在左侧和右侧对齐) :
>>> from docx.enum.text import WD_ALIGN_PARAGRAPH
>>> document = Document()
>>> paragraph = document.add_paragraph()
>>> paragraph_format = paragraph.paragraph_format
>>> paragraph_format.alignment
None # indicating alignment is inherited from the style hierarchy
>>> paragraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTER
>>> paragraph_format.alignment
CENTER (1)
缩进
缩进是段落与其容器边缘之间的水平空间,通常是页边距。段落可以在左侧和右侧分别缩进。第一行也可以具有与段落其余部分不同的缩进。第一行缩进比段落的其余部分缩进了第一行缩进