numpy.where (condition[, x, y])用法
- np.where(condition, x, y)
满足条件(condition),输出x,不满足输出y。
np.where([[True,False], [True,True]], # 官网上的例子
[[1,2], [3,4]],
[[9,8], [7,6]])
array([[1, 8],
[3, 4]])
- np.where(condition)
只有条件 (condition),没有x和y,则输出满足条件 (即非0) 元素的坐标 (等价于numpy.nonzero)。这里的坐标以tuple的形式给出,通常原数组有多少维,输出的tuple中就包含几个数组,分别对应符合条件元素的各维坐标。
np.where([[0, 1], [1, 0]])
(array([0, 1]), array([1, 0]))
栗子
#数据预处理
TFS_data_origin['Delivery_date'] = np.where((TFS_data_origin['Delivery_date']<TFS_data_origin['Date_of_submission'])|\
(TFS_data_origin['Delivery_date']<TFS_data_origin['Adopted_date']),\
None, TFS_data_origin['Delivery_date'])
#不同条件下计算
TFS_data_origin['Req_delivery_cycle'] = np.where(TFS_data_origin['standard_state'].map(lambda x:x=='已交付'),\
((TFS_data_origin['Delivered_date'] - TFS_data_origin['Date_of_submission']).dt.days + 1),\
None)