Python数据分析基础:NumPy常见错误(2),整数数组索引,使用两个一维数组索引

示例1

import numpy as np
a = np.arange(20).reshape(4, 5)
print(a)
"""
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 [15 16 17 18 19]]
"""
b = a[[1, 2], [3, 4]]
print(b)  # [ 8 14]

  b是想取两个数,一个坐标点(1, 2),另一个坐标点(3, 4),现在是索引,那物理点就是(2, 3)和(4, 5),取出来应该是(7, 19)啊,怎么是(8, 14)?
  这种索引方式叫整数数组索引,逗号有优先级,最大的优先级看a[, ]这一级逗号,前后分为行与列,所以[1, 2]都是行索引, [3, 4]都是列索引,对应的点,组合一下,分别是索引(1, 3)和(2, 4)。第二行第四列可不就是8,第三行第五列可不就是14。

示例2

import numpy as np
a = np.arange(12).reshape(3, 4)
"""
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
b1 = np.array([False, True, True])
b2 = np.array([True, False, True, False])
print(a[b1, b2])  # [ 4 10]

  用两个一维数组当索引?布尔索引是吧,是。怎么搞?
  先单独切吗?

print(a[b1])  # 只应用b1
"""
[[ 4  5  6  7]
 [ 8  9 10 11]]
"""
print(a[:, b2])  # 只应用b2
"""
[[ 0  2]
 [ 4  6]
 [ 8 10]]
"""

  再怎么搞?形状不一样也没法摞起来取交集。取相同元素吗?那8也应该有啊?看来不是。
  是不是把逻辑值运算一下?

b1 = np.array([False, True, True])
b2 = np.array([True, False, True, False])
c = pd.DataFrame(index=b1, columns=b2, dtype=bool)
for i1, i in enumerate(c.index):
    for j1, j in enumerate(c.columns):
        c.iloc[i1, j1] = i & j
"""
       True   False  True   False
False  False  False  False  False
True    True  False   True  False
True    True  False   True  False
"""

  是把交叉点上显示True的数取出吗?不对,有4个True,正确结果只有2个数啊。
  注意:布尔索引只对应,不运算!只对应,不运算!只对应,不运算!
  如何对应?
  看看b1中True现出的位置:[1, 2];
  看看b2中True现出的位置:[0, 2];
  整数数组索引有了:a[[1, 2], [0, 2]]。
  这就简单了,取两个数,一个数的索引坐标是(1, 0),取到4;另一个数的索引坐标是(2, 2),取到10。

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值