西雅图2014年日降水数据(后面要用)
import numpy as np
import pandas as pd
# 利用pandas抽取数据放入一个numpy数组
rainfall = pd.read_csv('../../datasets/Seattle2014.csv')['PRCP'].values
inches = rainfall / 254
inches.shape
输出:(365,)
直方图表示
%matplotlib inline
import matplotlib.pyplot as plt
import seaborn; seaborn.set()
plt.hist(inches,40);
输出:
上图可以看出的信息很少,如果我们想知道一年有多少天下雨,这些下雨天的平均降雨量是多少,多少天的降雨量超过了半英寸等等这些问题该怎么办呢?
用布尔逻辑和掩码可以解决,那么下面开始介绍他们。
比较操作
# 单比较
x = np.array([1,2,3,4,5])
x < 3 # 小于3
输出:
array([ True, True, False, False, False])
# 复合比较
(2 * x) == (x ** 2)
输出:
array([False, True, False, False, False])
操作布尔数组
np.random.seed(0) # 设定随机数种子
y = np.random.randint(1,10,[4,5])
y
输出:
array([[6, 1, 4, 4, 8], [4, 6, 3, 5, 8], [7, 9, 9, 2, 7], [8, 8, 9, 2, 6]])
多少值小于6?
np.count_nonzero(y < 6) # 法一
np.sum(y < 6) # 法二
每行有多少值小于6?
np.sum(y < 6, axis=1)
有没有值大于8?
np.any(y > 8)
所有值都小于10吗?
np.all(y < 10)
每行的值都小于8吗?
np.all(y < 8, axis=1)
布尔运算符
注:表里面的都是(bitwise logic operator)逐位逻辑运算符
与and和or不同,逐位是针对于元素的比特位,and和or是针对于对象整体
# 降水量0.5到1inches有几天
np.sum((inches > 0.5) & (inches < 1))
关键字 and / or 与逐位逻辑运算符 & / |
print('bit42:',bin(42))
print('bit59:',bin(59))
print('bin(42 & 59):',bin(42 & 59))
print('bin(42 | 59):',bin(42 | 59))
输出:
bit42: 0b101010 bit59: 0b111011 bin(42 & 59): 0b101010 bin(42 | 59): 0b111011
# 所有非零整数会被视为True
bool(42),bool(0)
输出:
(True, False)
bool(42 & 0),bool(42 and 0)
输出:
(False, False)
a = np.array([1,0,1,0])
b = np.array([1,1,0,0])
a & b # 与
输出:array([1, 0, 0, 0], dtype=int32);这里没有输出true或者false是因为dtype为整数形式,true的整数形式是1,false的整数形式是0,下面的输出同理。
a | b # 或
输出:array([1, 1, 1, 0], dtype=int32)
a ^ b # 异或
输出:array([0, 1, 1, 0], dtype=int32)
a and b # 报错
输出:
关键字and / or :对一个整体执行单个布尔运算
逐位逻辑运算符 :对一个对象的内容执行多个布尔运算
掩码
np.random.seed(0) # 设定随机数种子
y = np.random.randint(1,10,[4,5])
(y > 3) & (y < 8) # 利用比较运算符和逻辑符得到布尔数组
输出:
array([[ True, False, True, True, False], [ True, True, False, True, False], [ True, False, False, False, True], [False, False, False, False, True]])
y[(y > 3) & (y < 8)] # 从原数组取出满足条件的值(掩码操作)
输出:array([6, 4, 4, 4, 6, 5, 7, 7, 6])
所以掩码的意思是,通过比较运算符或逻辑运算符将数组按条件转换成为布尔数组,利用布尔数组取出原数组满足条件的值,这一系列操作就叫掩码操作