3-02-3 存储与加载 Excel 文件

存储与加载 Excel 文件

read_excel/to_excel() 函数是 pandas 用来存储与加载 Excel 文件的方法,但需要调用 Python 的 xlrd 模块来读取或写入 Excel 2003 (.xls) 版的文件或是用 openpyxl 模块来存取 Excel 2007+ (.xlsx) 版的文件。因此在使用这些函数前需要先安装 openpyxl 与 xlrd 模块。

在这里插入图片描述
图 3-2-2 安装存取 Excel 所需的包

将上例中的实例透过 to_excel() 函数写入 Excel 文件到磁盘,第一个参数是 Excel 文件的名字,而可选的第二个参数是 DataFrame 内的数据应该写入的数据表名称。

实例

import pandas as pd
  
dataDir = './data/2021_duplicate checking2.txt'
df = pd.read_csv(dataDir, sep='\t', encoding='GB18030') 
df.to_excel('./data/2021_duplicate checking2.xlsx', sheet_name='Sheet1', encoding='utf-8')

在这里插入图片描述

图 3-2-3 将 CSV 格式文件存储到 Excel 的指定数据表

也可以将两个数据框存储在同一个 Excel 表内的不同数据表,以下实例是将上节的两个 CSV 文件分别存入 bikeInfo 与 duplicate 数据表中。

实例

import pandas as pd
  
dataDir1 = './data/comptage_velo_2020.csv'
dataDir2 = './data/2021_duplicate checking2.txt'
  
df1 = pd.read_csv(dataDir1,nrows=100) 
df2 = pd.read_csv(dataDir2, nrows=100, sep='\t', encoding='GB18030') 
  
with pd.ExcelWriter('./data/merge.xlsx') as xlsxWriter:
    df1.to_excel(xlsxWriter, sheet_name='bikeInfo')
    df2.to_excel(xlsxWriter, sheet_name='duplicate')

在这里插入图片描述
图 3-2-4 将两份 CSV 文件存储到一份 Excel 的数据表

在加载 Excel 文件时,也可以透过位置的方式来读取,或是直接指定数据表名称。

实例

import pandas as pd
  
with pd.ExcelFile('./data/merge.xlsx') as xlsxReader:
    df1 = pd.read_excel(xlsxReader, sheet_name=0)
    df2 = pd.read_excel(xlsxReader, 'duplicate')
  
print(df1.iloc[:3,1:5])
print(df2.iloc[:3,1:5])
  
输出结果为:
            Date  compteur_100054073  compteur_100052606  compteur_100003032
0  2020/1/1 0:00                   0                   0                   0
1  2020/1/1 0:15                   0                   0                   1
2  2020/1/1 0:30                   0                   0                   0
   序号       专业   状态 检测结果
0   1  信息安全与管理  已上传   0%
1   2  信息安全与管理  已上传   0%
2   3     软件技术  已上传   0%

Python数据处理-文章目录

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Jupyter Notebook是一个非常强大的数据分析工具,可以实现数据储存和文件结构管理。本文将简单介绍如何使用Jupyter Notebook进行数据储存和文件结构管理。 数据储存 Jupyter Notebook 支持多种数据格式的读写,包括CSV、Excel、JSON、SQL、HDF5等。以下是一些基本的数据读写操作: 1. CSV 文件读写 使用 pandas 库中的 read_csv 函数可以读取 CSV 文件,并使用 to_csv 函数可以将 DataFrame 对象保存为 CSV 文件。 ```python import pandas as pd # 读取 CSV 文件 df = pd.read_csv('data.csv') # 将 DataFrame 对象保存为 CSV 文件 df.to_csv('data_new.csv') ``` 2. Excel 文件读写 使用 pandas 库中的 read_excel 函数可以读取 Excel 文件,并使用 to_excel 函数可以将 DataFrame 对象保存为 Excel 文件。 ```python import pandas as pd # 读取 Excel 文件 df = pd.read_excel('data.xlsx') # 将 DataFrame 对象保存为 Excel 文件 df.to_excel('data_new.xlsx') ``` 3. JSON 文件读写 使用 pandas 库中的 read_json 函数可以读取 JSON 文件,并使用 to_json 函数可以将 DataFrame 对象保存为 JSON 文件。 ```python import pandas as pd # 读取 JSON 文件 df = pd.read_json('data.json') # 将 DataFrame 对象保存为 JSON 文件 df.to_json('data_new.json') ``` 4. SQL 数据库读写 使用 pandas 库中的 read_sql 函数可以读取 SQL 数据库中的数据,并使用 to_sql 函数可以将 DataFrame 对象保存到 SQL 数据库中。 ```python import pandas as pd import sqlite3 # 连接 SQLite 数据库 conn = sqlite3.connect('data.db') # 读取 SQL 数据库中的数据 df = pd.read_sql('SELECT * FROM data_table', conn) # 将 DataFrame 对象保存到 SQL 数据库中 df.to_sql('data_table_new', conn) ``` 5. HDF5 文件读写 使用 pandas 库中的 read_hdf 函数可以读取 HDF5 文件,并使用 to_hdf 函数可以将 DataFrame 对象保存为 HDF5 文件。 ```python import pandas as pd # 读取 HDF5 文件 df = pd.read_hdf('data.h5') # 将 DataFrame 对象保存为 HDF5 文件 df.to_hdf('data_new.h5', key='data') ``` 文件结构管理 Jupyter Notebook 支持文件结构管理,并支持文件夹和文件的创建、删除和重命名操作。使用 Jupyter Notebook 的文件结构管理功能,可以更好地组织和管理数据分析项目的文件文件夹。 1. 文件夹和文件的创建 在 Jupyter Notebook 的文件浏览器中,可以通过点击 New Folder 或者 New 文件按钮来创建新的文件夹或者文件。 2. 文件夹和文件的删除 在 Jupyter Notebook 的文件浏览器中,可以通过选中要删除的文件夹或者文件,然后点击 Delete 按钮来删除它们。 3. 文件夹和文件的重命名 在 Jupyter Notebook 的文件浏览器中,可以通过选中要重命名的文件夹或者文件,然后点击 Rename 按钮来重命名它们。 总结 本文介绍了如何使用 Jupyter Notebook 进行数据储存和文件结构管理。数据储存方面,Jupyter Notebook 支持多种数据格式的读写,包括 CSV、Excel、JSON、SQL、HDF5 等;文件结构管理方面,Jupyter Notebook 支持文件夹和文件的创建、删除和重命名操作,可以更好地组织和管理数据分析项目的文件文件夹。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值