Pandas 14-读取各种类型文件

1. 读取 CSV 文件

CSV(Comma-Separated Values)文件是一种常见的文本文件格式,用于存储表格数据。

示例代码
import pandas as pd  
  
# 读取 CSV 文件  
df = pd.read_csv('data.csv')  
print(df)  

2. 读取 Excel 文件

Excel 文件是一种常见的电子表格文件格式,通常包含多个工作表。

示例代码
# 读取 Excel 文件  
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')  
print(df)  

3. 读取 JSON 文件

JSON(JavaScript Object Notation)文件是一种轻量级的数据交换格式,易于阅读和编写。

示例代码
# 读取 JSON 文件  
df = pd.read_json('data.json')  
print(df)  

4. 读取 SQL 数据库

Pandas 可以通过 SQLAlchemy 库读取 SQL 数据库中的数据。

示例代码
from sqlalchemy import create_engine  
  
# 创建数据库连接  
engine = create_engine('sqlite:///database.db')  
  
# 读取 SQL 数据库中的数据  
df = pd.read_sql_table('table_name', engine)  
print(df)  

5. 读取 HTML 文件

Pandas 可以读取 HTML 文件中的表格数据。

示例代码
# 读取 HTML 文件  
dfs = pd.read_html('data.html')  
print(dfs[0])  # 假设第一个表格是所需的数据  

6. 读取 Parquet 文件

Parquet 是一种高效的列式存储格式,适用于大数据处理。

示例代码
# 读取 Parquet 文件  
df = pd.read_parquet('data.parquet')  
print(df)  

7. 读取 HDF5 文件

HDF5 是一种用于存储大量数据的文件格式,支持分层数据存储。

示例代码
# 读取 HDF5 文件  
df = pd.read_hdf('data.h5', 'key')  
print(df)  

8. 读取 Feather 文件

Feather 是一种轻量级的二进制文件格式,适用于快速读写。

示例代码
# 读取 Feather 文件  
df = pd.read_feather('data.feather')  
print(df)  

9. 读取 Pickle 文件

Pickle 是 Python 的一种序列化格式,用于存储 Python 对象。

示例代码
# 读取 Pickle 文件  
df = pd.read_pickle('data.pkl')  
print(df)  

总结

Pandas 提供了丰富的功能来读取各种类型的文件,使得数据导入过程变得简单和高效。根据不同的数据源和需求,可以选择合适的读取方法。以下是一个完整的示例代码,展示了如何读取不同类型的文件:

import pandas as pd  
from sqlalchemy import create_engine  
  
# 读取 CSV 文件  
df_csv = pd.read_csv('data.csv')  
print("CSV 文件内容:")  
print(df_csv)  
  
# 读取 Excel 文件  
df_excel = pd.read_excel('data.xlsx', sheet_name='Sheet1')  
print("\nExcel 文件内容:")  
print(df_excel)  
  
# 读取 JSON 文件  
df_json = pd.read_json('data.json')  
print("\nJSON 文件内容:")  
print(df_json)  
  
# 读取 SQL 数据库  
engine = create_engine('sqlite:///database.db')  
df_sql = pd.read_sql_table('table_name', engine)  
print("\nSQL 数据库内容:")  
print(df_sql)  
  
# 读取 HTML 文件  
dfs_html = pd.read_html('data.html')  
print("\nHTML 文件内容:")  
print(dfs_html[0])  
  
# 读取 Parquet 文件  
df_parquet = pd.read_parquet('data.parquet')  
print("\nParquet 文件内容:")  
print(df_parquet)  
  
# 读取 HDF5 文件  
df_hdf5 = pd.read_hdf('data.h5', 'key')  
print("\nHDF5 文件内容:")  
print(df_hdf5)  
  
# 读取 Feather 文件  
df_feather = pd.read_feather('data.feather')  
print("\nFeather 文件内容:")  
print(df_feather)  
  
# 读取 Pickle 文件  
df_pickle = pd.read_pickle('data.pkl')  
print("\nPickle 文件内容:")  
print(df_pickle)  
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

司南锤

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值