Python——库docx(一)12.19-20

#安装库(在cmd中运行如下命令)
# pip install python-docx
# pip install -i https://pypi.tuna.tsinghua.edu.cn/simple python-docx
#出现 Successfully installed 安装成功
#官方教程(英文版)  https://python-docx.readthedocs.io/en/latest/#


#总体思路:
# Document:首先要有一个Document,也就是一个 Word 文档对象,打开不同的 Word 文档,就会有不同的 Document 对象,相互之间没有影响。
# Paragraph:是段落,一个 Word 文档由多个段落组成,当在文档中输入一个回车键,就会成为新的段落,输入 shift + 回车,不会分段。
# Run 表示一个节段,每个段落由多个 节段 组成,像 加粗,颜色,居中等等这些排版设计的东西。在paragraph中,这些东西叫做run。
# 一个段落中具有相同样式的连续文本,组成一个节段,所以一个 段落 对象有多个 Run 列表。

import docx
doc1 = docx.Document(r"C:\test.docx")   #如果()为空创建一个空的word文档;否则为打开指定路径的word文档。
doc1.save(r"C:\test.docx")  #保存文档到指定路径


#---------------------读取文档中的内容:

#从文档中遍历段落,以数组的形式分别存放。
for i in doc1.paragraphs: 
    print(i.text)

#从段中遍历节段,不同排版设计的内容为一个节段。
for j in 第一段.runs: 
    print(j.text)

#从文档中遍历表格
for 表 in doc1.tables:       #遍历出表
    for 行 in 表.rows:       #遍历出行
        for 单元格 in 行.cells:  #遍历出单元格
            print(单元格.text)   #输出单无格的内容


#---------------------向文档中写入内容:
doc1.add_heading('我是一个一级标题', level = 1)     #标题:在文档结尾处加一入一个一级标题,level参数可修改标题等级。
段 = doc1.add_paragraph("添加一个段落~")            #段落:在文档结尾处加一个正文,也就是段落。
图 = doc1.add_picture(r'C:\Users\Administrator\Desktop\1.png', width = docx.shared.Cm(10), height = docx.shared.Cm(8))       #图片:插入图片到文档,并设置图片的宽和高。
图.height = docx.shared.Cm(5)   #图片插入后,也可以再对图片尺寸进行修改。
doc1.add_page_break()                              #分页符
指定段 = doc1.paragraphs[1]                 #中间插入段落:在指定段落前面插入一个新的段落,可以用doc1.paragraphs[1]下标的方法先进行定位。
指定段.insert_paragraph_before('这是新插入的一个段落')

print(len(doc1.paragraphs))     #返回整个文档的段落数
print(len(doc1.inline_shapes))  #返回整个文档的图片数
print(doc1.inline_shapes[0].height,doc1.inline_shapes[0].width)     #输出文档中第一张图片的高和宽。

doc1.paragraphs[-1].clear()     #【删除】指定段落,-1就是最后一段。这里可以是图片。

#--------------------插入表格 行:rows; 列:columns;单元格:cells。
表格 = doc1.add_table(rows=5,cols=7)                      #表格:在文档中加入一个表格,5行7列。
表格.cell(0,0).text = "我是表格中的第一格。"                #给表格中的单元格赋值
表格.rows[1].cells[1].text = "我是另一种写法~~"            #第2行的,第1个单元格赋值。可以用于循环赋值。
表格.columns[1].cells[2].text = "我又是一种写法"           #第2行的,第2个单元格赋值。

doc1.tables[0].add_row()                                 #添加1行
doc1.tables[0].add_column(Cm(15))                        #添加1列,必须要有列宽数值。Cm,可导入:from docx.shared import Cm

表格._element.getparent().remove(表格._element)           #删除整个表格
行 = doc1.tables[0].rows[1]                              #取表格某行
列 = doc1.tables[0].columns[1]                           #取表格某列
行._element.getparent().remove(行._element)              #删除行

for 单元格 in 列.cells:                                 #删除列:但是删除列不可以直接删除整列,应当对单元格进行逐个删除。
    单元格._element.getparent().remove(单元格._element)



print(len(doc1.tablse))                                 #输出表格的个数
print(len(doc1.tables[0].rows))                         #输出表格的行数
print(len(doc1.tables[0].columns))                      #输出表格的列数

run = doc1.tables[0].cell(0,0).paragraphs[0].add_run()      #表格插入图片:指定表格0;指定行列0,0;指定段0;后面添加一个节段;然后将图片插入进去。
图 = run.add_picture(r'C:\Users\Administrator\Desktop\1.png', width = docx.shared.Cm(1), height = docx.shared.Cm(1))         #将图片插入指定节段中。


#--------------------格式设置
#不能对段直接设置格式,可以先创建一个空段,然后利用节段的方式一点点一写入并设置格式。
段.add_run('这是1个节段').bold = True      #加粗:设置节段内容加粗效果。
段.add_run('这是2个节段').italic = True    #斜体:设置节段内容斜体效果。

from docx.enum.text import WD_ALIGN_PARAGRAPH #设置对象居中、对齐等
doc1.paragraphs[1].alignment = WD_ALIGN_PARAGRAPH.CENTER    #段落对齐:CENTER居中;LEFT左;RIGHT右;JUSTIFY两端;DISTRIBUTE强制。其他对象同理。





  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值