【python】操作Excel和word模块

最新推荐文章于 2024-05-11 12:02:51 发布

zhipengit

最新推荐文章于 2024-05-11 12:02:51 发布

阅读量742

点赞数

文章标签： python excel word

本文链接：https://blog.csdn.net/hnjb5873/article/details/131789374

版权

一、Excel操作操作模块

.xls和.xlsx使用的两种不同的模块:

.xls: xlrd 常用函数

python操作excel主要用到xlrd和xlwt这两个库，即xlrd是读excel，xlwt是写excel的库。

data = xlrd.open_workbook(filename)#文件名以及路径，如果路径或者文件名有中文给前面加一个 r

获取book（excel文件）中一个工作表

table = data.sheets()[0]             #通过索引顺序获取
table = data.sheet_by_index(sheet_indx)  #通过索引顺序获取
table = data.sheet_by_name(sheet_name)  #通过名称获取
 
names = data.sheet_names()        #返回book中所有工作表的名字
data.sheet_loaded(sheet_name or indx)    # 检查某个sheet是否导入完毕

行的操作

nrows = table.nrows # 获取该sheet中的行数，注:这里table.nrows后面不带()
table.row(rowx) # 返回由该行中所有的单元格对象组成的列表,这与tabel.raw()方法并没有区别
table.row_slice(rowx) # 返回由该行中所有的单元格对象组成的列表 
table.row_types(rowx, start_colx=0, end_colx=None)# 返回由该行中所有单元格的数据类型组成的列表；
table.row_values(rowx, start_colx=0, end_colx=None) # 返回由该行中所有单元格的数据组成的列表
table.row_len(rowx) # 返回该行的有效单元格长度，即这一行有多少个数据

列（colnum）的操作

ncols = table.ncols # 获取列表的有效列数
table.col(colx, start_rowx=0, end_rowx=None) # 返回由该列中所有的单元格对象组成的列表
table.col_slice(colx, start_rowx=0, end_rowx=None) # 返回由该列中所有的单元格对象组成的列表
table.col_types(colx, start_rowx=0, end_rowx=None) # 返回由该列中所有单元格的数据类型组成的列表
table.col_values(colx, start_rowx=0, end_rowx=None) # 返回由该列中所有单元格的数据组成的列表

单元格的操作

table.cell(rowx,colx) # 返回单元格对象
table.cell_type(rowx,colx) # 返回对应位置单元格中的数据类型
table.cell_value(rowx,colx) # 返回对应位置单元格中的数据

.xlsx:openpyxl 常用函数

新建表格文件

from  openpyxl import  Workbook 
wb = Workbook() # 实例化
ws = wb.active # 激活 worksheet

打开已有

from openpyxl  import load_workbook
wb = load_workbook('data.xlsx')

写入数据

# 方式一：数据可以直接分配到单元格中(可以输入公式)
ws['A1'] = 42
# 方式二：可以附加行，从第一列开始附加(从最下方空白处，最左开始)(可以输入多行)
ws.append([1, 2, 3])
# 方式三：Python 类型会被自动转换
ws['A3'] = datetime.datetime.now().strftime("%Y-%m-%d")

创建表（sheet）

# 方式一：插入到最后(default)
ws1 = wb.create_sheet("Mysheet") 
# 方式二：插入到最开始的位置
ws2 = wb.create_sheet("Mysheet", 0)

选择表（sheet）

# sheet 名称可以作为 key 进行索引
ws3 = wb["new sheet"]
ws4 = wb.get_sheet_by_name("sheet1")

查看表名（sheet）

# 显示所有表名
wb.sheetnames
['Sheet2', 'New Title',  'Sheet1']
# 遍历所有表
for sheet in  wb:
	print(sheet.title)

访问单元格（cell）

# 方法一
cell = ws['A4']
# 方法二：row 行；column 列
cell = ws.cell(row=4, column=2, value=10)

保存数据

wb.save('文件名称.xlsx')

xlsx:openpyxl 封装类

# -*- coding: utf-8 -*-
from openpyxl import load_workbook
from openpyxl.utils import get_column_letter


class ExcelUtils:
    def __init__(self, filename):
        self.filename = filename
        self.workbook = load_workbook(filename)

    def read_cell(self, sheet, cell, encoding='utf-8'):
        value = sheet[cell].value
        if isinstance(value, str):
            return value.encode(encoding).decode(encoding)
        return value

    def write_cell(self, sheet, cell, value):
        sheet[cell].value = value

    def save(self):
        self.workbook.save(self.filename)

    def create_sheet(self, sheet_name):
        self.workbook.create_sheet(title=sheet_name)

    def delete_sheet(self, sheet_name):
        sheet = self.workbook[sheet_name]
        self.workbook.remove(sheet)

    def get_sheet_names(self):
        return self.workbook.sheetnames

    def get_row_count(self, sheet):
        return sheet.max_row

    def get_column_count(self, sheet):
        return sheet.max_column

    def get_column_letter(self, column_number):
        return get_column_letter(column_number)

    def get_sheet_by_index(self, index):
        sheet_names = self.get_sheet_names()
        if index < len(sheet_names):
            sheet_name = sheet_names[index]
            sheet = self.workbook[sheet_name]
            return sheet
        else:
            return None

if __name__ == '__main__':
    # 创建一个 ExcelUtils 实例
    excel = ExcelUtils('data.xlsx')

    # 获取工作表对象
    sheet = excel.get_sheet_by_index(0)  # 获取第一个工作表
    if sheet:
        # 读取单元格的值
        value = excel.read_cell(sheet, 'A1',encoding='utf-8')
        print(value)
    else:
        print("Sheet not found.")

二、word操作模块

要使用 Python 操作 Word 模板文件，可以使用 python-docx 库

封装工具

from docx import Document
from docxtpl import DocxTemplate


class WordUtils:
    def __init__(self, filename):
        self.filename = filename
        self.document = Document(filename)
        self.template = DocxTemplate(filename)

    def read_paragraph(self, paragraph_index):
        paragraphs = self.document.paragraphs
        if 0 <= paragraph_index < len(paragraphs):
            return paragraphs[paragraph_index].text
        else:
            return None

    def write_paragraph(self, paragraph_index, text):
        paragraphs = self.document.paragraphs
        if 0 <= paragraph_index < len(paragraphs):
            paragraphs[paragraph_index].text = text

    def read_table_cell(self, table_index, row_index, column_index):
        tables = self.document.tables
        if 0 <= table_index < len(tables):
            table = tables[table_index]
            if 0 <= row_index < len(table.rows) and 0 <= column_index < len(table.columns):
                cell = table.cell(row_index, column_index)
                return cell.text
        return None

    def write_table_cell(self, table_index, row_index, column_index, text):
        tables = self.document.tables
        if 0 <= table_index < len(tables):
            table = tables[table_index]
            if 0 <= row_index < len(table.rows) and 0 <= column_index < len(table.columns):
                cell = table.cell(row_index, column_index)
                cell.text = text

    def render_template(self, context):
        self.template.render(context)

    def save(self, output_filename):
        self.template.save(output_filename)

    def save_document(self, output_filename):
        self.document.save(output_filename)

if __name__ == '__main__':
    # 创建一个 WordUtils 实例
    word = WordUtils('template.docx')

    # 读取段落内容
    paragraph_text = word.read_paragraph(0)
    print(paragraph_text)

    # 写入段落内容
    word.write_paragraph(0, 'Hello, world!')

    # 读取表格单元格内容
    cell_text = word.read_table_cell(0, 1, 1)
    print(cell_text)

    # 写入表格单元格内容
    word.write_table_cell(0, 1, 1, 'New value')

    # 渲染模板
    context = {
        'name': 'John Doe',
        'age': 30,
        'occupation': 'Engineer'
    }
    word.render_template(context)

    # 保存渲染后的文档
    word.save('output.docx')

    # 保存原始文档（未渲染）
    word.save_document('original.docx')