pandas-对dataframe的操作，对行列的增加删除修改等操作

最新推荐文章于 2023-07-24 11:14:18 发布

大西瓜不甜

最新推荐文章于 2023-07-24 11:14:18 发布

阅读量960

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/mid_Faker/article/details/112221475

版权

本文详细介绍了Pandas中DataFrame对象的各种操作，包括如何分块读取大型CSV文件，保存DataFrame到CSV，增加、删除和修改数据，以及查询DataFrame数据。重点讲解了read_csv()和to_csv()函数的参数，以及增加列、行数据的方法，删除数据的drop()函数，查询数据的head(), tail(), loc[], iloc[]等方法，以及条件查询和修改数据的技巧。" 82048911,3529973,最小二乘法在线性模型中的应用与优缺点,"['机器学习', '线性模型', '最小二乘法', 'Python', 'sklearn']

摘要由CSDN通过智能技术生成

Pandas读取CSV文件主要用到的函数为：pandas.read_csv()

函数原型：

pandas.read_csv(filepath_or_buffer,   sep=', ',   delimiter=None,   header='infer', 
                names=None,   index_col=None,   usecols=None,   squeeze=False, 
                prefix=None,   mangle_dupe_cols=True,   dtype=None,   engine=None, 
                converters=None,   true_values=None,   false_values=None, 
                skipinitialspace=False,   skiprows=None,   nrows=None, 
                na_values=None,   keep_default_na=True,   na_filter=True, 
                verbose=False,   skip_blank_lines=True,   parse_dates=False,
                infer_datetime_format=False,   keep_date_col=False,   date_parser=None, 
                dayfirst=False,   iterator=False,   chunksize=None,   compression='infer',
                thousands=None,   decimal=b'.',   lineterminator=None,   quotechar='"',
                quoting=0,   escapechar=None,   comment=None,   encoding=None, 
                dialect=None,   tupleize_cols=None,    error_bad_lines=True, 
                warn_bad_lines=True,   skipfooter=0,    doublequote=True, 
                delim_whitespace=False,   low_memory=True,    memory_map=False, 
                float_precision=None)

常用参数：
filepath_or_buffer : 类型str，代表CSV文件地址。
sep : 类型str, 默认值为‘,’，用于指定分隔符。如果不指定参数，则会尝试使用逗号分隔。
header : 类型为int或者int的列表,它指定用来作为列名行号，然后数据从行号的下一行开始读取。默认情况下header是根据参数names（如下）
来推断header的值。如果names为None，则等价于header=0，默认把文件中第一行作为列名，数据从第一行开始读取。如果names显示地传入，
则等价于header=None，则数据从0行开始读取。如果传入header=0，names不为None，则将替换原有的列名。header参数可以是一个list。
例如：[0,1,3]，这个list表示将文件中的这些行作为列标题（意味着每一列有多个标题），介于中间