用 Python 给 Excel 表格截图(20250207)

我搜索了网络上的方案,感觉把 Excel 表格转换为 HTML 再用 platwright 截图是比较顺畅的路径,因为有顺畅的工具链。如果使用的是 Windows 系统则不需要阅读此文,因为 win32com 库更方便。这篇文章中 Excel 转 HTML 的方案,主要弥补了网上其他方案中存在合并单元格的情况。代码为智谱清言帮助生成,有些变量控制还是需要自己改一下。


from openpyxl import load_workbook
from openpyxl.styles import Font, Border, Side, Alignment
from playwright.sync_api import sync_playwright
from datetime import datetime

# 打开浏览器并截图
def capture_table_screenshot( url, output_file, table_selector):
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=False)
        page = browser.new_page()
        # 注意这里需要加协议
        page.goto("file://" + url)
        
        # 等待表格元素加载完成
        page.wait_for_selector(table_selector)
        page.wait_for_timeout(1000)
        
        # 对表格元素进行截图
        table_element = page.locator(table_selector)
        table_element.screenshot(path=output_file)
        
        browser.close()

# 默认合并单元格的文本内容是放在左上单元格的,如果不是,需要专门程序处理。
# 边框样式默认为1px solid
def read_excel(file_path):
    # data_only 将 Excel 表格里的公式计算成数值读取出来。
    wb = load_workbook( filename=file_path, data_only=True)
    ws = wb.active  # 读取活动工作表
    data = []
    merges = []  # 用于存储合并单元格的信息
    cell_styles = []
    
    # 读取合并单元格信息
    for merged_range in ws.merged_cells.ranges:
        start_row, start_col = merged_range.min_row, merged_range.min_col
        end_row, end_col = merged_range.max_row, merged_range.max_col
        merges.append((start_row-1, start_col-1, end_row-1, end_col-1))

    for row in ws.iter_rows():
        row_data = []
        row_styles = []

        for
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值