NumPy数组可以将许多种数据处理任务表述为简洁的数组表达式(否则需要编写循环),用数组表达式代替循环的做法,通常被称为矢量化。一般来说,矢量化数组运算要比等价的纯Python方式快上一两个数量级(甚至更多) ,尤其是各种数值计算。
1.将条件逻辑表述为数组运算
假设根据cond中的值选取xarr和yarr的值:当cond中的值为True时,选取xarr的值,否则从yarr中选取。
- python列表推导式(由纯python完成,大数组处理速度慢且无法用于多维数组)
- 使用np.where
np.where的第二个和第三个参数不必是数组,它们都可以是标量值。如将cond为true的替换为2,为false的替换为-2。
2.数学和统计方法
sum、mean以及标准差std等聚合计算&#