Pandas的read_csv和 to_csv函数参数分析详解
1. read_csv
read_csv方法定义
pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None,
index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True,
dtype=None, engine=None, converters=None, true_values=None, false_values=None,
skipinitialspace=False, skiprows=None, nrows=None, na_values=None,
keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True,
parse_dates=False, infer_datetime_format=False, keep_date_col=False,
date_parser=None, dayfirst=False, iterator=False, chunksize=None,
compression='infer', thousands=None, decimal=b'.', lineterminator=None,
quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None,
dialect=None, tupleize_cols=False, error_bad_lines=True, warn_bad_lines=True,
skipfooter=0, skip_footer=0, doublequote=True, delim_whitespace=False,
as_recarray=False, compact_ints=False, use_unsigned=False,
low_memory=True, buffer_lines=None, memory_map=False, float_precision=None)
读取文件路径,可以是URL,可用URL类型包括:http, ftp, s3和文件。
常用参数
sep :str, default ‘,' 指定分隔符。如果不指定参数,则会尝试使用逗号分隔。csv文件一般为逗号分隔符。
delimiter : str, default None 定界符,备选分隔符(如果指定该参数,则sep参数失效)
delim_whitespace :boolean, default False. 指定空格(例如' ‘或者' ‘)是否作为分隔符使用,等效于设定sep='\s+'。 如果这个参数设定为Ture那么delimiter 参数失效。
header :int or list of ints, default ‘infer' 指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0,否则设置为None。对于数据读取有表头和没表头的情况很实用
header :int or list of ints, default ‘infer' 指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0,否则设置为None。
names : array-like, default None 用于结果的列名列表,对各列重命名,即添加表头。 如数据有表头,但想用新的表头,可以设置header=0,names=['a','b']实现表头定制。
index_col : int or sequence or False, default None 用作行索引的列编号或者列名,如果给定一个序列则有多个行索引。 可使用index_col=[0,1]来指定文件中的第1和2列为索引列。
usecols : array-like, default None 返回一个数据子集,即选取某几列,不读取整个文件的内容,有助于加快速度和降低内存。 usecols=[1,2]或use