pandas筛选列报错 raise KeyError(key) KeyError: ‘r3‘

在使用pandas的df进行筛选的时候出现报错:

核心问题在于对df筛选的时候索引列不在dataframe的范围内了。查询gpt有以下几种可能:

  1. 访问不存在的列:

    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    print(df['C'])  # KeyError: 'C'
    

    在这个例子中,df中没有名为 'C' 的列,所以会引发 KeyError

  2. 访问不存在的行索引:

    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}, index=['a', 'b', 'c'])
    print(df.loc['d'])  # KeyError: 'd'
    

    这里尝试访问不存在的行索引 'd',也会引发 KeyError

  3. 使用 dict 键访问不存在的列:

    data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
    df = pd.DataFrame(data)
    print(df['C'])  # KeyError: 'C'
    

    与第一种情况类似,在 dict 中不存在 'C' 这个键。

  4. 使用 iloc 访问超出范围的位置:

    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    print(df.iloc[3, 0])  # KeyError: 3
    

    这里尝试访问超出 DataFrame 行数范围的位置 3,会引发 KeyError

 另一个关键点:

pandas在读取Excel的时候默认NA为NaN,即空值。但此时在Excel中"NA"表现为字符串,如果直接在df中筛选"NA"就会无法匹配。

解决办法:

使用pd.read_excel()函数时,并设置na_filter参数为False。这样 Pandas 就不会自动将NA识别为缺失值,而是会将其读取为字符串类型,如下:

df = pd.read_excel('your_excel_file.xlsx', na_filter=False)
  • 5
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值