python第二阶段（10）pandas入门基础-数据IO

最新推荐文章于 2024-05-26 04:36:52 发布

DD546250327

最新推荐文章于 2024-05-26 04:36:52 发布

阅读量277

点赞数

文章标签： python

本文链接：https://blog.csdn.net/DD546250327/article/details/108591891

版权

本文介绍了pandas库中的read_csv和read_table函数，用于从CSV和表格文件中读取数据到DataFrame。详细讲解了各项参数，如filepath_or_buffer、sep、header、names、index_col、usecols等，帮助理解如何灵活处理数据输入。

摘要由CSDN通过智能技术生成

1 pandas.read_csv

将逗号分隔值（csv）文件读取到DataFrame中在这里插入图片描述

1、filepath_or_buffer:读取的文件路径，URL（包含http,ftp,s3）链接等
2、2、sep : str , default’,’ 指定分隔符。如果不指定参数，则会尝试使用逗号分隔。分隔符长于一个字符并且不是‘\s+’,将使用python的语法分析器。并且忽略数据中的逗号。正则表达式例子：’\r\t’
3、delimiter：分隔符。当定义了delimiter参数后，sep就失去了作用。
4、delim_whitespace : boolean, default False。否指定空格(例如’ ‘或者’\t ‘)作为分隔符使用，等效于设定sep=’\s+’。如果这个参数设定为Ture那么delimiter 参数失效。
有了delim_whitespace后，分隔符我们就简化成了,和sep=’\s+'一样能处理各种常见分割符。
5、header : int or list of ints, default ‘infer’。
指定行数用来作为列名，数据开始行数。如果文件中没有列名，则默认为0，否则设置为None。如果明确设定header=0 就会替换掉原来存在列名。header参数可以是一个list例如：[0,1,3]，这个list表示将文件中的这些行作为列标题（意味着每一列有多个标题），介于中间的行将被忽略掉
6、names : array-like, default None
用于结果的列名列表，如果数据文件中没有列标题行，就需要执行header=None。默认列表中不能出现重复，除非设定参数mangle_dupe_cols=True。
7、index_col : int or sequence or False, default None
用作行索引的列编号或者列名，如果给定一个序列则有多个行索引。
如果文件不规则，行尾有分隔符，则可以设定index_col=False 来是的pandas不适用第一列作为行索引。
8、usecols : arra

最低0.47元/天解锁文章

DD546250327

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python第二阶段（10）pandas入门基础-数据IO

pandas入门基础-数据IO1 pandas.read_csv2 pandas.read_table1 pandas.read_csv将逗号分隔值（csv）文件读取到DataFrame中1、filepath_or_buffer:读取的文件路径，URL（包含http,ftp,s3）链接等2、2、sep : str , default’,’ 指定分隔符。如果不指定参数，则会尝试使用逗号分隔。分隔符长于一个字符并且不是‘\s+’,将使用python的语法分析器。并且忽略数据中的逗号。正则表达式例子：’
复制链接

扫一扫