Pandas——⑤读取导出文件

本文介绍了如何使用Pandas在Python中读取CSV和pickle文件,并演示了`read_csv`和`to_pickle`方法的实际应用,包括创建和保存数据文件的过程。

Pandas——读取导出文件

python入门常用操作:https://blog.csdn.net/qq_33302004/article/details/112859327

 

新建数据文件:

内容如下:

import pandas as pd

# 储存或者调用数据表格
# pandas中可以读取的格式:
# read_csv / read_excel / read_hdf / read_sql / read_json / read_msgpack / read_html /
# read_gbq / read_stata / read_sas / read_clipboard / read_pickle

# 推荐csv和pickle
# csv是最基础简单的格式、pickle是python自带的压缩格式

# pandas中的保存方式:
# to_csv / to_excel / to_hdf / to_sql / to_json / to_msgpack / to_html /
# to_gbq / to_stata / to_sas / to_clipboard / to_pickle

# 读取
dates = pd.read_csv('3-pandas/笔记5-students.csv')
print(dates)
# 存储
dates.to_pickle('3-pandas/笔记5-students.pickle')
dates_2 = pd.read_pickle('3-pandas/笔记5-students.pickle')
print(dates_2)

使用to_pickle文件夹下出现保存后的文件:

### 使用 Pandas 读取包含中文的 XLSX 文件 为了成功读取包含中文字符的 Excel (`.xlsx`) 文件,确保文件本身采用兼容的编码格式非常重要。通常情况下,Excel 文件内部已经采用了适合多字节字符集(如 UTF-8 或 GBK)保存的方式,因此大多数时候不需要额外调整编码设置。 对于具体的读取操作,可以按照如下方式进行: ```python import pandas as pd # 定义文件路径以及工作表名称 file_path = 'example.xlsx' sheet_name = 'Sheet1' # 设置列头信息并加载数据 data = pd.read_excel(file_path, sheet_name=sheet_name, header=0) # 如果需要自定义列名,可以通过 names 参数传递列表形式的新列名 custom_column_names = ['第一列', '第二列', '第三列'] data_custom_columns = pd.read_excel( file_path, sheet_name=sheet_name, header=None, names=custom_column_names ) ``` 如果遇到乱码问题或者无法正常解析的情况,建议先尝试将 `.xlsx` 文件转换成其他格式再重新导入,比如通过 Excel 应用程序将其另存为 CSV 并指定合适的编码格式后再利用 `read_csv()` 函数来处理[^3]。不过针对原始需求——直接读取 `.xlsx` 文件而言,在绝大多数场景下上述方法应该能够满足要求。 #### 处理特殊字符或潜在错误提示 当面对可能存在的特殊字符导致的问题时,除了确认源文件本身的编码外,还可以考虑增加一些参数选项以便更好地控制输入过程中的异常情况处理机制。例如,使用 `encoding_errors='ignore'` 来忽略不可解码的字符,但这可能会丢失部分重要信息;更好的做法是在必要时明确指定期望使用的编码标准,像这样: ```python data_with_encoding = pd.read_excel( io=file_path, engine='openpyxl', encoding='utf_8_sig' # 尝试不同的编码方案直到找到最适合的一个 ) ``` 需要注意的是,`pd.read_excel()` 不支持直接传入 `encoding` 参数用于解决文本编码问题,因为 Excel 文件不是纯文本文件而是二进制结构化存储的数据集合体。所以这里提到的编码设定主要是针对那些被导出CSV 后缀但仍保留着 Excel 特征的文档来说的有效措施[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值