pandas读写文本格式数据和csv.Dialect属性

这篇博客介绍了如何使用pandas的read_csv和read_table加载数据,以及DataFrame的to_csv方法导出数据。同时,讨论了Python内置的csv模块,特别是csv.Dialect参数,包括delimiter、lineterminator等,用于自定义文件格式。内容还涵盖了如何处理复杂文件和使用split、正则表达式进行数据清洗。
摘要由CSDN通过智能技术生成

pandas学习笔记(二)

上一篇笔记记录了关于pandas 数据载入的介绍

read_csv
从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符

read_table
从文件、URL或文件型对象读取分隔好的数据,制表符 ‘\t’ 是默认分隔符

而关于数据导出文件:

使用 DataFrame 的 to_csv 方法,可以将数据导出为逗号分隔的文件

写入到 sys.stdout 控制台中打印文本,可以用其他分隔符

import sys
data.to_csv(sys.stdout,sep='|')

缺失值在输出时以空字符串输出,na_rep=‘NULL’

行和列的标签一般会被写入,但可以禁止写入
index=False
header=False

===========================
Unix 用 !cat mine/ex.csv
Windows 用 !type mine/ex.csv

接收一个带有一行或多行的错误的文件

对任何带有单字符分隔符的文件,可以使用python的内建 csv 模块,使用时,需要将任一打开的文件或文件型对象传给 csv.reader

import csv
f=open(
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值