Python之Excel数据相关

本文介绍了如何使用Python库openpyxl处理Excel文件,包括创建、编辑和创建图表,以及与之对比的CSV文件处理。同时提到了pandas库在数据处理中的角色,展示了如何导出CSV和xlsx文件实例。
摘要由CSDN通过智能技术生成

Excel

Microsoft Excel是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件。直观的界面、出色的计算功能和图表工具,再加上成功的市场营销,使Excel成为最流行的个人计算机数据处理软件。在1993年,作为Microsoft Office的组件发布了5.0版之后,Excel就开始成为所适用操作平台上的电子制表软件的霸主。

它也为早起Microsoft Office三大办公基本应用(Word、Excel、PowerPoint)之一。

Excel分为两种格式:xls(Excel 97-2003)和xlsx(Excel 2007及以上)

CSV(Comma Separated Values)

它是以逗号为分隔符的纯文本文件,而 Excel 文件是 Microsoft Office 软件生成的一种电子表格文件。

下面表格对比两者区别

扩展名格式编辑功能大小兼容性
xlsx(xls)包含复杂的格式,如图表,公式,宏等可以使用 Microsoft Office 软件进行编辑Excel 文件具有丰富的分析和计算功能较大兼容性取决于使用的软件版本
csv只包含简单的文本和数字可以使用任何文本编辑器,如 Notepad 或 Sublime TextCSV 文件仅提供简单的数据存储功能较小具有较高的兼容性

示例

import os
import csv
import codecs
import openpyxl
from openpyxl.descriptors import NoneSet
from openpyxl.styles import (
    Font,
    Color,
    PatternFill
)
from openpyxl.chart import (
    PieChart,
    Reference
)

red = PatternFill("darkGrid", "FF0000", "FF0000")  # 填充颜色红色
green = PatternFill("lightUp", '00FFFF99')  # 填充颜色绿色
yellow = PatternFill("lightUp", "FFFF00")  # 填充颜色黄色
blue = PatternFill("solid", "33ccff")  # 填充颜色蓝色


class DealExport:
    """
    type() 可以打印python对象类型
    如果是字典对象 可以直接使用 dict()强转
    如果是集合对象 可以直接使用 list()强转
    使用 json.loads() 可以将 JSON字符串解码为 Python对象
    使用 json.dumps(obj, ensure_ascii=False) 可以将python对象obj转换成JSON字符串对象, ensure_ascii=False可以解决中文乱码问题
    """

    def __init__(self):
        self.export_path = os.path.join(os.getcwd(), "data")

    def exportFileWithCSV(self, file_name, head, content):
        with open(os.path.join(self.export_path, file_name), mode='w', encoding='utf-8', newline='') as file:
            if file.tell() == 0:
                file.write(codecs.BOM_UTF8.decode("utf-8"))
            writer = csv.writer(file)
            writer.writerow(head)
            for row in content:
                writer.writerow(row)

    def exportFileWithXlsx(self, file_name, head, content):
        # 矩阵置换
        matrix = list(zip(*content))
        # 创建一个新的Excel文件
        workbook = openpyxl.Workbook()
        # 选择默认的活动工作表
        sheet = workbook.active
        # 输出工作表名
        ws = workbook.create_sheet('my_sheet', 0)
        totalRows = len(head)
        totalColumn = len(content)
        # for row in range(1, totalRows + 1):
        # ws.insert_rows(totalRows, totalColumn) # 在第一行插入rows列
        for i in range(0, totalRows):
            # 第 1 行 和 第 i+1 列 设置元素
            ws.cell(1, i + 1, head[i])
            self.setStyle(ws, i)
        for i in range(0, totalColumn):
            # 内容
            row = content[i]
            ws.append(row)
            # ws.row_dimensions[i + 2].fill = red
            # ws.row_dimensions[i + 1].height = 25
            # 读取数据表格范围
        for i in range(2, ws.max_row + 1):
            for j in range(1, ws.max_column + 1):
                ws.cell(i, j).fill = yellow
        # 设置列宽,列宽column_dimensions参数是列标签
        ws.column_dimensions['B'].width = 160

        # # 创建饼状图
        # pie = PieChart()
        # # 说明 第 1 列 第 1行 至 第 headLen 行
        # labels = Reference(ws, 1, 1, totalRows)
        # # 数据
        # data = Reference(ws, totalColumn, 2, totalRows, 2)
        # pie.add_data(data, True)
        # pie.set_categories(labels)
        # pie.title = "测试饼状图"
        #
        # ws.add_chart(pie, "D1")
        # 保存Excel文件
        workbook.save(os.path.join(self.export_path, file_name))

    def setStyle(self, sheet, index):
        # 设置字体样式
        font = Font('Arial', True, True, Color('00000000'))
        sheet['A1'].font = font
        # 设置单元格背景颜色
        # state = NoneSet(values=(['visible', 'hidden', 'veryHidden', 'show']))
        # 首行
        sheet.cell(1, index + 1).fill = PatternFill('solid', '0000FFFF', '0000FFFF')


if __name__ == '__main__':
    deal = DealExport()
    head = ("对象", "名称", "描述", "类型", "第一年数量", "第二年数量", "第三年数量", "第四年数量")
    content = [["TYPE_A", "This must be subclassed", "demo", "add", 1, 2, 3, 4],
               ["TYPE_B", "Defines the interface for stateless encoders/decoders", "demo", "delete", 2, 3, 4, 5],
               ["TYPE_C",
                "Encodes the object input and returns a tuple" + "\n" + "--" * 30 + "\n" + "Decodes the object input and returns a tuple",
                "demo", "update", 3, 4, 5, 6],
               ["TYPE_D", "Creates an IncrementalEncoder instance.", "demo", "add", 4, 5, 6, 7],
               ["TYPE_E",
                "This subclass of IncrementalEncoder can be used as the baseclass for an incremental encoder if the encoder must keep some of the output in a buffer between calls to encode()",
                "demo", "update", 5, 6, 7, 8]]
    deal.exportFileWithCSV("test.csv", head, content)
    deal.exportFileWithXlsx("test.xlsx", head, content)

输出csv文件结果如下,大小为675字节
在这里插入图片描述
输出xlsx文件结果如下,大小为6KB = 6144字节
在这里插入图片描述

补充

操作excel表格除了openpyxl模块以外,还有pandas模块等,其他模块可参见参考链接3。

  • openpyxl是Python中操作Excel文件的库,支持读写Excel文件,使用简单方便。
  • pandas是Python中广泛使用的数据处理库,支持多种数据类型,如时间序列、表格数据等,同时也支持多种文件格式,如Excel、CSV、JSON等。pandas中主要的数据结构是Series和DataFrame。其中,Series可以视为一维数组,DataFrame可以视为二维数据表。

参考

  1. 腾讯云_一文看懂用Python读取Excel数据
  2. CSDN_openpyxl包操作Excel文件
  3. Python操作Excel教程
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值