pandas_数据导出

本文介绍了如何使用pandas库将数据导出为.xlsx和.csv文件。详细讲解了设置文件导出路径、Sheet名称、索引、列选择、编码格式、缺失值和无穷值处理的方法。同时,还阐述了如何将数据导出到多个Sheet。
摘要由CSDN通过智能技术生成

pandas 数据导出

1.导出为.xlsx文件

在pandas中将文件导出为.xlsx格式,用到的是df.to_excel()

1.1 设置文件导出路径

df.to_excel(excel_writer = r"C:\User\aaaaa\Desktop\测试文档.xlsx")

注意:如果同一导出文件已经在本地打开,则不能再次运行导出代码,会报错,需要将本地文件关闭以后再次运行导出代码。

1.2 设置Sheet名称
.xlsx格式的文件有多个Sheet,Sheet的默认命名方式是Sheet后加阿拉伯数字,通常从 Sheet1往上递增,我们也可以对默认的Sheet 名字进行修改,只要修改sheet_name参数即可

df.to_excel(excel_writer = r"C:\User\aaaaa\Desktop\测试文档.xlsx",sheet_name = "测试文档"

1.3 设置索引
上面导出文件中关于索引的参数都是默认的,也就是没有对索引做什么限制,但是index的索引使用的是从0开始的默认自然数索引,这种索引是没有意义的,设置参数index=False就可以在导出时把这种索引去掉

df.to_excel(excel_writer = r"C:\User\aaaaa\Desktop\测试文档.xlsx",
             sheet_name = "测试文档",
             index = False

1.4 设置要导出的列
有的时候一个表的列数很多,我们并不需要把所有的列都导出,这个时候就可以通过设置columns参数来指定要导出的列,这和导入设置只导入部分列的原理类似

#文件只导出用户ID、7月销量、8月销量、9月销量
df.to_excel(excel_writer = r"C:\User\aaaaa\Desktop\测试文档.xlsx",
             sheet_name = "测试文档",
             index = False,
             columns = ["用户ID","7月销量","8月销量",
以下是使用pandas从MySQL数据库读取数据导出到Excel的步骤: 1. 首先,确保已经安装了必要的依赖包,包括PyMySQL、pandas、sqlalchemy和openpyxl。可以使用以下命令进行安装: ```shell pip install PyMySQL pandas sqlalchemy openpyxl ``` 2. 导入所需的库: ```python import pandas as pd from sqlalchemy import create_engine ``` 3. 创建与MySQL数据库的连接: ```python # 创建数据库连接 engine = create_engine('mysql+pymysql://username:password@host:port/database_name') ``` 请将`username`、`password`、`host`、`port`和`database_name`替换为实际的数据库连接信息。 4. 使用pandas的`read_sql_query`函数从数据库中读取数据: ```python # 读取数据 query = 'SELECT * FROM table_name' df = pd.read_sql_query(query, engine) ``` 请将`table_name`替换为实际的表名。 5. 对数据进行必要的处理和转换。 6. 使用pandas的`to_excel`函数将数据导出到Excel文件: ```python # 导出数据到Excel df.to_excel('output.xlsx', index=False) ``` 请将`output.xlsx`替换为实际的输出文件名。 以下是一个完整的示例代码: ```python import pandas as pd from sqlalchemy import create_engine # 创建数据库连接 engine = create_engine('mysql+pymysql://username:password@host:port/database_name') # 读取数据 query = 'SELECT * FROM table_name' df = pd.read_sql_query(query, engine) # 对数据进行必要的处理和转换 # 导出数据到Excel df.to_excel('output.xlsx', index=False) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值