Python学习——csv文件读取:read_csv()基本参数应用

本文详细介绍了Python中用于读取CSV文件的read_csv()函数,包括filepath_or_buffer、sep、header、names、index_col、usecols、prefix、mangle_dupe_cols、engine、skipinitialspace、skiprows、skipfooter、nrows、keep_default_na、na_filter和encoding等关键参数的用法和功能。通过实例展示了如何使用这些参数进行数据读取和处理。
摘要由CSDN通过智能技术生成

(本文是笔者查阅一定资料整理原创所写,受知识面限制,如存在错误,欢迎指出)
Python作为一门年轻的计算机语言,在近些年来大数据与人工智能等前沿科技革命的推动下经历着高速发展,一度呈现赶超传统语言的趋势。
作为大数据分析领域的一个新人,python成为笔者当下最需要学好的一项技能,而大数据分析离不开数据清洗,数据清洗的第一步便是将数据读入,现就python中的read_csv()函数出发,通过分析最常使用的参数,熟悉其基本操作。
下表为笔者使用的数据:
在这里插入图片描述
下表为常见参数及其部分信息:
在这里插入图片描述
1.filepath_or_buffer
该参数是唯一不能缺失的参数,其目的是提供读取文件路径,对于大多数初学者而言,读取内容通常为电脑上对应文件,现读取笔者位于E:\MYWORK下的csv文件edu.csv
代码如下:

import pandas as pd
df=pd.read_csv("E:/MYWORK/edu.csv",encoding="gbk")
print(df)

Spyder环境显示如下:
在这里插入图片描述
2.sep demlimiter
两关键字分别表示分隔符和定界符,同时demlimiter还有备选分隔符的功能,且优先度高于sep,当指定delimiter参数时,sep参数就会失效。通常情况下csv文件以逗号作为分隔符。
3.header
header关键字的主要功能有两个:第一是将指定行的数据作为读取数据各列的列名,由最初读取数据显示出的信息表明,edu文件文件中第一排的“姓名”“居住地”“年级”“年龄”“是否住校”依次成为了各列的列名,这是因为header默认参数为0,即将edu文件中第一排作为列名的缘故。现我们修改参数:

import pandas as pd
df=pd.read_csv("E:/MYWORK/edu.csv"
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值