csv逗号分隔符转换_Python读写csv文件专题教程(1)

最新推荐文章于 2024-05-31 09:44:10 发布

weixin_39977488

最新推荐文章于 2024-05-31 09:44:10 发布

阅读量1.6k

点赞数

本文是Python数据分析包Pandas中read_csv函数的专题教程，讲解了如何读取csv文件，包括基本参数如filepath_or_buffer、sep、header、names等，以及列和索引位置、名称的设置，同时探讨了处理重复列名和缺失值的方法。通过实例展示了如何处理不同分隔符、选择特定列、设置索引，并提到了其他相关参数和时间处理等。

摘要由CSDN通过智能技术生成

1 前言

Python的数据分析包Pandas具备读写csv文件的功能，read_csv 实现读入csv文件，to_csv写入到csv文件。每个函数的参数非常多，可以用来解决平时实战时，很多棘手的问题，比如设置某些列为时间类型，当导入列含有重复列名称时，当我们想过滤掉某些列时，当想添加列名称时...

这篇专题我们结合官方文档，带你全面了解这些常用的参数，真正用透这2个函数。实际上，通过这2个函数的学习，我们不光能理解透这两个函数，顺便还可以了解更多Pandas的知识点，下面开始我们的专题之旅。

2 read_csv

读入一个带分隔符的csv文件到DataFrame中，也支持遍历或文件分割为数据片(chunks).

下面是函数的原型：

read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

2.1 基本参数

filepath_or_buffer: 数据输入路径，可以是文件路径，也可以是URL，或者实现read方法的任意对象。

sep: 数据文件的分隔符，默认为逗号。假如sep为None，python引擎会通过内置的 csv.Sniffer工具自动判断分隔符。

注意：如果分割字符长度大于1，且不是 '\s+', 启动python引擎解析。

举例： test.csv文件分割符为 '\t', 如果使用sep默认的逗号分隔符，读入后的数据混为一体。

In [4]: df = pd.read_csv('test.csv')

In [5]: df

Out[5]:

id\tname\tage

0 1\t'gz'\t10

1 2\t'lh'\t12

此时，sep必须设置为 '\t'，数据方可正确读入。再变换test.csv的分割符为两个空格，此时分隔符设置为 \s+ 就可以正确读入。

In [7]: df = pd.read_csv('test.csv',sep='\s+')

最低0.47元/天解锁文章

weixin_39977488

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
csv逗号分隔符转换_Python读写csv文件专题教程(1)

1 前言Python的数据分析包Pandas具备读写csv文件的功能，read_csv 实现读入csv文件，to_csv写入到csv文件。每个函数的参数非常多，可以用来解决平时实战时，很多棘手的问题，比如设置某些列为时间类型，当导入列含有重复列名称时，当我们想过滤掉某些列时，当想添加列名称时...这篇专题我们结合官方文档，带你全面了解这些常用的参数，真正用透这2个函数。实际上，通过这2个...
复制链接

扫一扫