详解pandas的read_csv函数

一、官网参数

        pandas官网参数网址:pandas.read_csv — pandas 1.5.2 documentation

如下所示:

 二、常用参数详解

1、filepath_or_buffer(文件)

        一般指读取文件的路径。比如读取csv文件。【必须指定

import pandas as pd

df_1 = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv")

print(df_1)

2、sep(分隔符)

        指定分隔符。如果不指定参数,默认逗号分隔。常见的分隔符:英文逗号(,),制表符(\t),竖线(|)。其中,英文逗号最常用。

import pandas as pd

df_1 = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv",sep=',')

print(df_1)

3、 header(表头)

        表头即列名,默认第0行数据为表头。【从0开始计数】,以下为excel示意表头。

 如果数据没有表头,可以通过header=None表示。

import pandas as pd

df_1 = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv",sep=',',header=None)

print(df_1)

结果如下,第0行成为数据,列名重置为0、1、2。因此,需要仅对无表头数据设置此参数。

 4、names(列名)

        用于原始数据无表头,又想设置列名的情况。如下数据,直接读取,默认0、1、2为列名:

import pandas as pd

df_1 = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv",sep=',',header=None)

print(df_1)

 

         如果需要给列命名,可以通过names参数设定列名,即可将数据列命名。

import pandas as pd

df_1 = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv",sep=',',header=None,
                   names=['name','age','income'])

print(df_1)

 5、dtype(数据类型)

    指定字段数据类型。例如:

import pandas as pd

df_1 = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv",sep=',',header=None,
                   names=['name','age','income'],
                    dtype={'name':str,'age':int,'income':int})

print(df_1)
print(df_1.dtypes)

指定name列为str类型,age和income为int数据类型。【pandas中的object即python的str】

6、engine(引擎)

        pandas解析数据时用的引擎。pandas 目前的解析引擎提供两种:c、python,默认为 c,因为 c 引擎解析速度更快,但是特性没有 python 引擎全。如果使用 c 引擎没有的特性时,会自动退化为 python 引擎。

        与我们使用密切相关的:有时候读取数据文件会报错:OSError: Initializing from file failed

 那么此时需要设定    engine='python'   ,即可成功读取文件。

import pandas as pd

df_1 = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv",sep=',',header=None,
                   names=['name','age','income'],engine='python')

print(df_1)

7、skiprows(跳过指定行)

        对于前N行数据不想要读进内存,可以指定此参数跳过。

未指定结果:

        

指定  skiprows=1 即跳过一行结果:

import pandas as pd

df_1 = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv",sep=',',header=None,
                   names=['name','age','income'],engine='python',skiprows=1)

print(df_1)

 8、encoding(编码)

        文件编码:一般为  utf8  或者  gbk  编码。

如何查看与修改文件编码:如何修改文件的编码_Python伊甸园的博客-CSDN博客_如何修改文件的编码格式

import pandas as pd

df_1 = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv",sep=',',header=None,
                   names=['name','age','income'],engine='python',skiprows=1,
                   encoding='utf8')

print(df_1)

       以上就是最常用的pandas读取数据文件参数信息。

公众号内有更多干货分享哦~~

  • 4
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
pandasread_csv函数是用于读取CSV文件的功能。你可以通过指定文件路径来读取文件。例如,你可以使用以下代码读取名为data1.csv的文件: ``` import pandas as pd df = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv") ``` 在读取CSV文件时,你也可以指定分隔符来解析数据。默认情况下,分隔符是逗号。如果你的文件中使用了不同的分隔符,你可以使用sep参数来指定。例如,如果你的文件使用分号作为分隔符,你可以使用以下代码: ``` import pandas as pd df = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv", sep=';') ``` 另外,如果你的CSV文件没有表头,你可以使用header参数来指定。默认情况下,header参数的值是"infer",它会尝试自动推断表头。但是如果你的数据没有表头,你可以将header参数设置为None。例如: ``` import pandas as pd df = pd.read_csv(r"C:\Users\wwb\Desktop\data1.csv", header=None) ``` 这样,你就可以详细了解pandasread_csv函数的使用方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [详解pandasread_csv函数](https://blog.csdn.net/weixin_42830697/article/details/128717371)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值