用python的pandas打开csv文件_python读写数据读写csv文件(pandas用法)

最新推荐文章于 2024-08-06 18:05:02 发布

weixin_39714307

最新推荐文章于 2024-08-06 18:05:02 发布

阅读量2.1k

点赞数 1

文章标签：用python的pandas打开csv文件

本文链接：https://blog.csdn.net/weixin_39714307/article/details/112032876

版权

本文介绍了Python中使用Pandas库进行CSV文件的读取和写入操作，包括`read_csv`函数的常用参数及其解释，以及数据清洗的一些基本方法，如处理NaN值、删除重复值和数据替换等。

摘要由CSDN通过智能技术生成

python中数据处理是比较方便的，经常用的就是读写文件，提取数据等，本博客主要介绍其中的一些用法。Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。

一、pandas读取csv文件

数据处理过程中csv文件用的比较多。

import pandas as pd

data = pd.read_csv("F:/Zhu/test/test.csv")

下面看一下pd.read_csv常用的参数：

pandas.read_csv(filepath_or_buffer, sep=", ", delimiter=None, header="infer", names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression="infer", thousands=None, decimal=b".", lineterminator=None, quotechar=""", quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

常用参数解释：read_csv与read_table常用的参数(更多参数查看官方手册)：

filepath_or_buffer #需要读取的文件及路径

sep / delimiter 列分隔符，普通文本文件，应该都是使用结构化的方式来组织，才能使用dataframe

header 文件中是否需要读取列名的一行，header=None(使用names自定义列名,否则