python第二阶段(10)pandas入门基础-数据IO

本文介绍了pandas库中的read_csv和read_table函数,用于从CSV和表格文件中读取数据到DataFrame。详细讲解了各项参数,如filepath_or_buffer、sep、header、names、index_col、usecols等,帮助理解如何灵活处理数据输入。
摘要由CSDN通过智能技术生成

pandas入门基础-数据IO

1 pandas.read_csv

将逗号分隔值(csv)文件读取到DataFrame中在这里插入图片描述

1、filepath_or_buffer:读取的文件路径,URL(包含http,ftp,s3)链接等
2、2、sep : str , default’,’ 指定分隔符。如果不指定参数,则会尝试使用逗号分隔。分隔符长于一个字符并且不是‘\s+’,将使用python的语法分析器。并且忽略数据中的逗号。正则表达式例子:’\r\t’
3、delimiter:分隔符。当定义了delimiter参数后,sep就失去了作用。
4、delim_whitespace : boolean, default False。否指定空格(例如’ ‘或者’\t ‘)作为分隔符使用,等效于设定sep=’\s+’。如果这个参数设定为Ture那么delimiter 参数失效。
有了delim_whitespace后,分隔符我们就简化成了,和sep=’\s+'一样能处理各种常见分割符。
5、header : int or list of ints, default ‘infer’。
指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0,否则设置为None。如果明确设定header=0 就会替换掉原来存在列名。header参数可以是一个list例如:[0,1,3],这个list表示将文件中的这些行作为列标题(意味着每一列有多个标题),介于中间的行将被忽略掉
6、names : array-like, default None
用于结果的列名列表,如果数据文件中没有列标题行,就需要执行header=None。默认列表中不能出现重复,除非设定参数mangle_dupe_cols=True。
7、index_col : int or sequence or False, default None
用作行索引的列编号或者列名,如果给定一个序列则有多个行索引。
如果文件不规则,行尾有分隔符,则可以设定index_col=False 来是的pandas不适用第一列作为行索引。
8、usecols : arra

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值