示例1
import numpy as np
a = np.arange(20).reshape(4, 5)
print(a)
"""
[[ 0 1 2 3 4]
[ 5 6 7 8 9]
[10 11 12 13 14]
[15 16 17 18 19]]
"""
b = a[[1, 2], [3, 4]]
print(b) # [ 8 14]
b是想取两个数,一个坐标点(1, 2),另一个坐标点(3, 4),现在是索引,那物理点就是(2, 3)和(4, 5),取出来应该是(7, 19)啊,怎么是(8, 14)?
这种索引方式叫整数数组索引,逗号有优先级,最大的优先级看a[, ]这一级逗号,前后分为行与列,所以[1, 2]都是行索引, [3, 4]都是列索引,对应的点,组合一下,分别是索引(1, 3)和(2, 4)。第二行第四列可不就是8,第三行第五列可不就是14。
示例2
import numpy as np
a = np.arange(12).reshape(3, 4)
"""
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
"""
b1 = np.array([False, True, True])
b2 = np.array([True, False, True, False])
print(a[b1, b2]) # [ 4 10]
用两个一维数组当索引?布尔索引是吧,是。怎么搞?
先单独切吗?
print(a[b1]) # 只应用b1
"""
[[ 4 5 6 7]
[ 8 9 10 11]]
"""
print(a[:, b2]) # 只应用b2
"""
[[ 0 2]
[ 4 6]
[ 8 10]]
"""
再怎么搞?形状不一样也没法摞起来取交集。取相同元素吗?那8也应该有啊?看来不是。
是不是把逻辑值运算一下?
b1 = np.array([False, True, True])
b2 = np.array([True, False, True, False])
c = pd.DataFrame(index=b1, columns=b2, dtype=bool)
for i1, i in enumerate(c.index):
for j1, j in enumerate(c.columns):
c.iloc[i1, j1] = i & j
"""
True False True False
False False False False False
True True False True False
True True False True False
"""
是把交叉点上显示True的数取出吗?不对,有4个True,正确结果只有2个数啊。
注意:布尔索引只对应,不运算!只对应,不运算!只对应,不运算!
如何对应?
看看b1中True现出的位置:[1, 2];
看看b2中True现出的位置:[0, 2];
整数数组索引有了:a[[1, 2], [0, 2]]。
这就简单了,取两个数,一个数的索引坐标是(1, 0),取到4;另一个数的索引坐标是(2, 2),取到10。