pandas文件IO(导入导出)

pandas文件IO(导入导出)

# 1. 导入相关库
import pandas as pd
import numpy as np

# 2. read_csv读取
df = pd.read_csv('data/ex1.csv')

# 3. 文件有间隔符
df = pd.read_csv('data/ex1.csv', sep=',')

# 4. 列名缺失
pd.read_csv('data/ex2.csv', header=None)

# 5. 自定义列名
pd.read_csv('data/ex2.csv', header=None, names=['a', 'b', 'c', 'd', 'msg'])

# 6. 指定行索引
pd.read_csv('data/ex2.csv', header=None, names=['a', 'b', 'c', 'd', 'msg'], index_col='msg')

# 7. 多层行索引
pd.read_csv('data/ex2.csv', header=None, names=['a', 'b', 'c', 'd', 'msg'], index_col=['msg', 'a'])

# 8. 处理不规格分隔符(正则表达式)
pd.read_table('data/ex3.csv', sep='\s+')

# 9. 缺失值处理,将某值作为nan
pd.read_csv('data/ex5.csv', na_values=['NA', 'NULL', 'foo'])

# 10. 缺失值,对某列进行缺失值读取
pd.read_csv('data/ex5.csv', na_values={'message': ['foo', 'NA'], 'something': ['two']})

# 11. 逐块读取数据,前几行
pd.read_csv('data/ex6.csv', nrows=10)

# 12. 保存到磁盘
df.to_csv('data/ex5_out.csv')

# 13. 不写索引及列名称
df.to_csv('data/ex5_out.csv', index=False, header=None)

# 14. # 指定分隔符保存
df.to_csv('data/ex5_out.csv', index=False, sep='|')

# 15  只写出一部分列
df.to_csv('data/ex5_out.csv', index=False, columns=['a', 'b', 'message'])

# 16.二进制保存
pd.to_pickle(df, 'data/ex1_pickle.bin')

# 17. 二进制读取
pd.read_pickle('data/ex1_pickle.bin')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值