pandas csv读取——用实际样例介绍read_csv方法参数

本文介绍了pandas的read_csv方法,强调了掌握其参数的重要性。通过样例,详细解释了filepath、sep、header和skiprows等参数的用法,包括直接调用、设置header、使用lambda表达式跳过奇偶行以及与header结合的使用情况。内容以实际操作和效果分析为主,旨在帮助读者理解如何根据需求读取csv文件。
摘要由CSDN通过智能技术生成

当我们需要使用pandas读取csv文件时,目的是为了得到一个合适的DataFrame。pandas有内置方法 read_csv() ,仅仅知道这个方法是不够的,还需要进一步熟悉它的参数,这样才能根据我们的需求来读取文件。

1.为了熟悉它的用法,首先推荐官方文档

参见 官方文档
官方文档里有非常详细的说明。如果各位时间充裕,还是建议查看官方文档。下面是我个人学习的一点体会。不足之处,欢迎大家交流讨论。

2.个人学习心得

2.1常用参数说明(filepath,sep,header,skiprows等)

参数名称 参数作用
filepath 文件的路径(完整的绝对路径或者相对路径)
sep 类型为str。csv文件中每一行数据之间的分隔符。官方文档指出对于read_csv()这个参数默认是英文逗号’ ,’而对于read_table()这个参数默认是制表符 ‘|t’ 。当然用户可以根据自己csv文件格式的特点自行设置。read_csv()还有一个参数是 delimeter, 作用与sep相同,只不过delitemer的默认值为None,而不是英文逗号 ‘,’
skiprows 值为整数或者可调用的函数,当指为整数时,作用是从文件头开始跳过无用的数据行(以0为起始下标)。当skiprows是一个可以调用的函数时,会读取符合该函数定义的规则的行。
header 值为整数,指定pd.DataFrame的columns的名称在哪一行

下面以读一个csv文件为例,展示下相关用法:

2.1.1参数使用示例

example.csv的前11行,其中前两行为无效数据,第三行为数据列的名称,最后十行为有效数据

error,line,1
error,line,2
fans_num,date,comment
1,2019-04-18,我恐高,咋办。
0,2019-04-18,这段时间行情不错,好几天T加1了想找几个信得过的朋友一起。
0,2019-04-18,为什么你们能发图
3,2019-04-18,股民越恐高--指数逐浪高
3,2019-04-18,奶奶滴个雄,一个星期的时间,从赚两万到亏三万,无语了
187,2019-04-18,今天大盘指数创业板指数上证50指数都跌了12个点,幺俩=要凉!
0
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值