【pandas】IndexingError: Unalignable boolean Series provided as indexer 解决办法

错误示例:

import pandas as pd
import numpy as np

df = pd.DataFrame({'a':[1,2,np.nan,np.nan], 'b':[4,np.nan,6,np.nan], 'c':[np.nan, 8,9,np.nan], 'd':[np.nan,np.nan,np.nan,np.nan]})

df = df[df.notnull().any(axis = 0)]

print df

完整报错:
IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match
出现此问题的原因是Series索引列未对齐
df[ ]是寻找基于行的索引,而不是列的索引

解决办法:

# 使用loc函数
print (df.notnull().any(axis = 0))
a     True
b     True
c     True
d    False
dtype: bool

df = df.loc[:, df.notnull().any(axis = 0)]

或者修改行标签之后用 [ ] 选择

print (df.columns[df.notnull().any(axis = 0)])
Index(['a', 'b', 'c'], dtype='object')

df = df[df.columns[df.notnull().any(axis = 0)]]
print (df)

print (df.dropna(axis=1, how='all'))
  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这个错误通常是由于索引不匹配引起的。具体来说,通常是在使用布尔索引时出现了这个问题,因为布尔索引要求索引的长度和布尔值的长度必须相等,并且要求两者的索引必须匹配。如果两者的索引不匹配,就会触发 `IndexingError`。 例如,假设你有两个 DataFrame,分别是 `df1` 和 `df2`,并且它们的索引不匹配。你想要使用 `df1` 中的一个布尔 Series 来选择 `df2` 中的一些行,你可以这样做: ``` import pandas as pd df1 = pd.DataFrame({'A': [True, False, True], 'B': [1, 2, 3]}) df2 = pd.DataFrame({'C': [4, 5, 6], 'D': [True, False, True], 'E': ['a', 'b', 'c']}) mask = df1['A'] result = df2[mask] print(result) ``` 输出: ``` --------------------------------------------------------------------------- IndexingError Traceback (most recent call last) <ipython-input-4-3e0a7e8e9d7e> in <module>() 5 df2 = pd.DataFrame({'C': [4, 5, 6], 'D': [True, False, True], 'E': ['a', 'b', 'c']}) 6 mask = df1['A'] ----> 7 result = df2[mask] 8 print(result) ... IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match). ``` 你可以看到,这个例子中出现了 `IndexingError`,因为 `df1` 和 `df2` 的索引不匹配。在这种情况下,你需要确保两个 DataFrame 的索引一致,或者使用 `reset_index()` 方法来将其中一个 DataFrame 的索引重置为默认的整数索引。例如,你可以这样修改上面的代码: ``` import pandas as pd df1 = pd.DataFrame({'A': [True, False, True], 'B': [1, 2, 3]}, index=['a', 'b', 'c']) df2 = pd.DataFrame({'C': [4, 5, 6], 'D': [True, False, True], 'E': ['a', 'b', 'c']}) mask = df1['A'] result = df2[mask.reset_index(drop=True)] print(result) ``` 输出: ``` C D E 0 4 True a 2 6 True c ``` 在这个例子中,我将 `df1` 的索引修改为了 `['a', 'b', 'c']`,并使用 `reset_index()` 方法将 `mask` 的索引重置为默认的整数索引。这样,就可以使用 `mask` 来选择 `df2` 中的行了。注意,由于 `mask` 的索引已经重置了,所以在使用布尔索引时不需要考虑索引不匹配的问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值