经常忘记怎么操作,还经常需要用到这个包,只好记下来了。
pandas读取csv文件
官网地址:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
这个函数里面的参数很多很多,但是日常用的就是
pandas.read_csv(filepath_or_buffer,header='infer',index_col=None,usecols=None,nrows=None,na_values=None,)
filepath_or_buffer
:.csv
文件的路径地址或者URL
地址header
: int, list of int, default ‘infer’,infer
表示自动推断文件里是否有表头,一般看文件第一行与后面行的文件类型是否相同,header=2
表示设置第2行为表头,也可以设置多行为表头。这个参数要解决的问题是将哪一行或者哪几行设置为header
,并且忽略之前的数据;index_col
: int, str, sequence of int / str, or False, default None,index_col=2
表示将第2列的值设置为index
列,index_col
的类型为str
时,str
是属于header
里的,这个参数要解决的问题就是将哪一列或者是哪几列设置为index
;usecols
: list-like or callable, optional,可选参数,选择读取部分列的数据,可以是整型列表,字符串列表甚至是满足某些条件的函数,这个函数的输入是header
所在的那一行;nrows
: int, optional, 读取的行数,适合用于较大的文件;na_values
: scalar, str, list-like, or d