python自动生成大数据量Excel文件

xlwt模块只支持Excel2007之前的版本,格式为:xls文件,且单个sheet只支持最大行数为65535,一旦数据量超出限制行数,则会报出以下异常:

ValueError: row index was 65536, not allowed by .xls format

此时,openpyxl模块则是一个很不错的选择了,openpyxl 模块用来处理Excel 2007及以上版本的文件,也就是.xlsx、.xlsm、xltx、xltm格式的文件,最大支持行数1048576。

openpyxl模块安装方法:

$ pip install openpyxl

实例:以下脚本实现了从mysql数据库查询数据集自动生成Excel文件

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-

import datetime
import os
import sys

import mysql.connector
from openpyxl import Workbook


def mkdir(path):
    dir = os.path.dirname(path)
    isExists = os.path.exists(dir)
    if not isExists:
        os.makedirs(path)

    return path


def query_mysql(host, port, user, passwd, db, sql):
    try:
        mydb = mysql.connector.connect(host=host, user=user, port=port, passwd=passwd, database=db)
        # 创建游标
        mycursor = mydb.cursor()
        # 执行mysql
        mycursor.execute(sql)
    except Exception as err:
        print("Mysql_ERROR :%s " % err)
        sys.exit(-1)
    else:
        field = [filed[0] for filed in mycursor.description]
        datas = mycursor.fetchall()
        dict = {'field': field, 'datas': datas}
        mydb.close()
        return dict


def export_excel(path, field, datas):
    try:
        # 写入excel表格
        book = Workbook()
        sheet = book.active
        # 写入 “列名”
        for col, filed in enumerate(field, start=1):
            sheet.cell(row=1, column=col).value = str(filed)
        # 写入 “数据”
        row = 2
        for data in datas:
            for col, d in enumerate(data, start=1):
                sheet.cell(row=row, column=col).value = str(d)
            row += 1
        # 保存
        book.save(path)
    except Exception as err:
        print(err)


def main():
    # 从mysql查询结果集
    host, port, user, passwd, db = '192.168.96.9', '3306', 'root', 'abc123', 'dbname'
    sql = """select * from table;"""
    dict_datas = query_mysql(host, port, user, passwd, db, sql)

    # 写入xlsx文件
    path = './output/导出全表数据_{}.xlsx'.format(datetime.datetime.now().strftime('%Y%m%d%H%M%S'))
    field = dict_datas.get('field')
    datas = dict_datas.get('datas')
    export_excel(mkdir(path), field, datas)


    if __name__ == "__main__":
        main()

openpyxl 参考:https://openpyxl.readthedocs.io/en/stable/

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 首先,需要安装 `pandas` 和 `matplotlib` 库,这两个库分别用于读取和处理 Excel 文件以及画图。 接下来,你可以这样写代码: ```python import pandas as pd import matplotlib.pyplot as plt # 读取 Excel 文件 df = pd.read_excel('文件路径/文件名.xlsx') # 把日期列转换为日期格式 df['日期列'] = pd.to_datetime(df['日期列']) # 按月度分组,并计算每月的和 monthly_sum = df.groupby(df['日期列'].dt.to_period('M')).sum() # 画图 monthly_sum.plot(kind='bar') plt.show() ``` 其中,`'文件路径/文件名.xlsx'` 是你的 Excel 文件的路径和文件名,`'日期列'` 是 Excel 文件中日期所在的列名。 希望这对你有帮助! ### 回答2: 在Python中,可以使用pandas和matplotlib库来处理和绘制Excel文件中的数据。根据问题描述,假设要将Excel文件中的数据按月份进行可视化。 首先,我们需要安装pandas和matplotlib库。可以使用以下命令在终端中安装这两个库: ``` pip install pandas matplotlib ``` 然后,我们可以使用如下代码将Excel文件读取为一个pandas的DataFrame对象,并从中提取出需要的日期和数据列: ```python import pandas as pd # 读取Excel文件 df = pd.read_excel('file.xlsx') # 提取日期列和数据列 date_column = 'date' # 假设日期列的名称为'date' data_column = 'data' # 假设数据列的名称为'data' df[date_column] = pd.to_datetime(df[date_column]) # 将日期列转换为pandas的datetime类型 ``` 接下来,我们可以使用resample方法对数据按月份进行重采样,并选择一个聚合函数(例如求和、平均等)以确定每个月的数据: ```python # 按月份重采样数据 monthly_data = df.set_index(date_column).resample('M')[data_column].sum() # 假设要求和,可以修改为.mean()、.max()等 # 将重采样后的数据绘图 monthly_data.plot(kind='bar') plt.show() ``` 以上代码将数据按月份重采样后绘制成柱状图,可以使用`kind`参数调整为其他类型的图形(例如折线图、散点图等)。 最后,保存上述代码为一个Python脚本(例如`monthly_plot.py`),然后在终端中运行以下命令,即可生成按月份分组的图形: ``` python monthly_plot.py ``` ### 回答3: 要用Python编写程序将Excel文件按月份进行可视化,需要使用pandas和matplotlib两个库。 首先,要导入所需的库: ```python import pandas as pd import matplotlib.pyplot as plt ``` 然后,读取Excel文件: ```python df = pd.read_excel('文件路径.xlsx') ``` 接着,将日期列转换为日期时间格式,以便根据月份进行分组: ```python df['日期列'] = pd.to_datetime(df['日期列']) ``` 然后,使用pandas的groupby函数将数据按月份进行分组,并计算每个月份的总和、平均值或其他统计(根据需求而定): ```python monthly_data = df.groupby(df['日期列'].dt.month).sum() # 根据月份分组并计算总和 ``` 最后,使用matplotlib库将数据可视化为图表: ```python # 可视化为柱状图 plt.bar(monthly_data.index, monthly_data['数值列']) plt.xlabel('月份') plt.ylabel('总和(或其他统计)') plt.title('每月总和(或其他统计)图表') plt.show() # 可视化为折线图 plt.plot(monthly_data.index, monthly_data['数值列']) plt.xlabel('月份') plt.ylabel('总和(或其他统计)') plt.title('每月总和(或其他统计)图表') plt.show() ``` 其中,'日期列'是Excel文件中存储日期的列名,'数值列'是要进行统计和可视化的数据列名。可以根据自己的实际情况修改这两个名称。 以上就是用Python编写程序将Excel文件按月份进行可视化的代码。根据具体需求,可以进一步添加其他功能和样式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值