Pandas 14-读取各种类型文件

司南锤

于 2024-09-03 11:48:23 发布

阅读量321

点赞数 2

分类专栏： pandas python基础学习文章标签： pandas

本文链接：https://blog.csdn.net/qq_52964132/article/details/141857660

版权

python基础学习同时被 2 个专栏收录

69 篇文章 1 订阅

订阅专栏

pandas

17 篇文章 0 订阅

订阅专栏

1. 读取 CSV 文件

CSV（Comma-Separated Values）文件是一种常见的文本文件格式，用于存储表格数据。

示例代码

import pandas as pd  
  
# 读取 CSV 文件  
df = pd.read_csv('data.csv')  
print(df)

2. 读取 Excel 文件

Excel 文件是一种常见的电子表格文件格式，通常包含多个工作表。

示例代码

# 读取 Excel 文件  
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')  
print(df)

3. 读取 JSON 文件

JSON（JavaScript Object Notation）文件是一种轻量级的数据交换格式，易于阅读和编写。

示例代码

# 读取 JSON 文件  
df = pd.read_json('data.json')  
print(df)

4. 读取 SQL 数据库

Pandas 可以通过 SQLAlchemy 库读取 SQL 数据库中的数据。

示例代码

from sqlalchemy import create_engine  
  
# 创建数据库连接  
engine = create_engine('sqlite:///database.db')  
  
# 读取 SQL 数据库中的数据  
df = pd.read_sql_table('table_name', engine)  
print(df)

5. 读取 HTML 文件

Pandas 可以读取 HTML 文件中的表格数据。

示例代码

# 读取 HTML 文件  
dfs = pd.read_html('data.html')  
print(dfs[0])  # 假设第一个表格是所需的数据

6. 读取 Parquet 文件

Parquet 是一种高效的列式存储格式，适用于大数据处理。

示例代码

# 读取 Parquet 文件  
df = pd.read_parquet('data.parquet')  
print(df)

7. 读取 HDF5 文件

HDF5 是一种用于存储大量数据的文件格式，支持分层数据存储。

示例代码

# 读取 HDF5 文件  
df = pd.read_hdf('data.h5', 'key')  
print(df)

8. 读取 Feather 文件

Feather 是一种轻量级的二进制文件格式，适用于快速读写。

示例代码

# 读取 Feather 文件  
df = pd.read_feather('data.feather')  
print(df)

9. 读取 Pickle 文件

Pickle 是 Python 的一种序列化格式，用于存储 Python 对象。

示例代码

# 读取 Pickle 文件  
df = pd.read_pickle('data.pkl')  
print(df)

总结

Pandas 提供了丰富的功能来读取各种类型的文件，使得数据导入过程变得简单和高效。根据不同的数据源和需求，可以选择合适的读取方法。以下是一个完整的示例代码，展示了如何读取不同类型的文件：

import pandas as pd  
from sqlalchemy import create_engine  
  
# 读取 CSV 文件  
df_csv = pd.read_csv('data.csv')  
print("CSV 文件内容：")  
print(df_csv)  
  
# 读取 Excel 文件  
df_excel = pd.read_excel('data.xlsx', sheet_name='Sheet1')  
print("\nExcel 文件内容：")  
print(df_excel)  
  
# 读取 JSON 文件  
df_json = pd.read_json('data.json')  
print("\nJSON 文件内容：")  
print(df_json)  
  
# 读取 SQL 数据库  
engine = create_engine('sqlite:///database.db')  
df_sql = pd.read_sql_table('table_name', engine)  
print("\nSQL 数据库内容：")  
print(df_sql)  
  
# 读取 HTML 文件  
dfs_html = pd.read_html('data.html')  
print("\nHTML 文件内容：")  
print(dfs_html[0])  
  
# 读取 Parquet 文件  
df_parquet = pd.read_parquet('data.parquet')  
print("\nParquet 文件内容：")  
print(df_parquet)  
  
# 读取 HDF5 文件  
df_hdf5 = pd.read_hdf('data.h5', 'key')  
print("\nHDF5 文件内容：")  
print(df_hdf5)  
  
# 读取 Feather 文件  
df_feather = pd.read_feather('data.feather')  
print("\nFeather 文件内容：")  
print(df_feather)  
  
# 读取 Pickle 文件  
df_pickle = pd.read_pickle('data.pkl')  
print("\nPickle 文件内容：")  
print(df_pickle)

司南锤

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
Pandas 14-读取各种类型文件

Pandas 提供了丰富的功能来读取各种类型的文件，使得数据导入过程变得简单和高效。根据不同的数据源和需求，可以选择合适的读取方法。# 读取 CSV 文件print("CSV 文件内容：")# 读取 Excel 文件print("\nExcel 文件内容：")# 读取 JSON 文件print("\nJSON 文件内容：")# 读取 SQL 数据库print("\nSQL 数据库内容：")# 读取 HTML 文件print("\nHTML 文件内容：")
复制链接

扫一扫