1 python数据分析numpy基础之setdiff1d求两个数组的差集
python的numpy库的setdiff1d(x,y)函数,表示数组x与y的差,即在x且不在y中的元素,且进行去重排序。
用法
numpy.setdiff1d(ar1, ar2, assume_unique=False)
描述
numpy.setdiff1d(ar1,ar2),求两个数组ar1和ar2的差,返回在ar1且不在ar2中的元素,并且去重排序,最终返回的是ar1的元素。
入参
ar1,ar2:必选,列表、元组、数组;如果是多维则自动转一维数组;
assume_unique:如果ar1和ar2的元素唯一不重复,则设置为True,可以加快计算速度;
如果设置为True,则结果不进行去重和排序。
1.1 入参ar1和ar2
numpy.setdiff1d(ar1,ar2)的入参ar1和ar2,为必选入参,可以为数组、列表、元组。如果是多维数组,将会转换为一维数组后,进行处理。
若元素在ar1且不在ar2中,则返回此元素。
>>> import numpy as np
# setdiff1d(ar1,ar2)
# 返回在ar1且不在ar2的元素,并且进行去重排序
# ar1,ar2为列表
>>> np.setdiff1d([9,8,6,5,2,5,6],[1,3,9])
array([2, 5, 6, 8])
# ar1,ar2为元组
>>> np.setdiff1d((9,8,6,5,2,5,6),(1,3,9))
array([2, 5, 6, 8])
# ar1,ar2为数组
>>> np.setdiff1d(np.array((9,8,6,5,2,5,6)),np.array((1,3,9)))
array([2, 5, 6, 8])
# ar1,ar2多维自动转1维,再进行处理
>>> np.setdiff1d([[9,8,6,5],[2,5,6,1]],[[1,3],[9,3]])
array([2, 5, 6, 8])
1.2 入参assume_unique
numpy. in1d()的入参assume_unique,为可选入参,布尔类型,默认为False。如果ar1数组的元素是唯一不重复的,则可以设置为True,可以加快计算速度。如果ar1数组有重复元素,并且assume_unique为True,则结果不进行去重和排序。
>>> import numpy as np
# 如果ar1的元素唯一不重复,则可以设置assume_unique=True,加快计算速度
# 如果assume_unique=True,且ar1的元素有重复,则不去重和排序
>>> np.setdiff1d([9,8,6,5,2,5,6],[1,3,9],assume_unique=True)
array([8, 6, 5, 2, 5, 6])
>>> np.setdiff1d([9,8,6,5,2,5,6],[1,3,9],assume_unique=False)
array([2, 5, 6, 8])