一.集合set
(1)集合是无序的,不重复的数据集合,它里面的元素的类型是可哈希的(即:不可变类型),但是集合本身是可变类型,能够进行增删查操作。
(2)空集合的表示方法:set()
(3)集合的作用:
1. 数据去重,把一个列表变成集合,就自动去重。
2. 关系测试,测试两组数据的并集,交集,差集等...
# 创建元组
set1 = {1,2,3,4}
print(set1)
>>> {1, 2, 3, 4}
# 集合的元素都是不可变类型,所以只能包含数值,字符串,元组。
set2 = {1,2,3,['python']}
print(set2)
>>>>>>TypeError: unhashable type: 'list'
#通过set()方法创建集合
set3 = set({1,2,3,'barry'})
print(set3)
# 集合的操作
(1)增
#谨记:集合是无序的
'''add()'''
set1 = {'alex','wusir','evj','taibai'}
set1.add('he')
print(set1)
>>>{'he', 'alex', 'evj', 'wusir', 'taibai'}
'''update():把可迭代对象的元素分别增加'''
set1 = {'alex','wusir','evj','taibai'}
set1.update('A')
print(set1)
>>>{'alex', 'taibai', 'A', 'evj', 'wusir'}
set1.update('老师')
print(set1)
>>> {'taibai', '老', 'wusir', 'evj', '师', 'alex'}
set1.update([1,2,3])
print(set1)
>>> {1, 'wusir', 2, 3, 'evj', 'alex', 'taibai'}
(2)删
'''remove(element):删除一个元素,如果不存在,则报错'''
set1 = {'alex','wusir','evj','taibai'}
set1.remove('alex')
set1.remove('he') #元素不存在,则会报错
>>>KeyError: 'he'
print(set1)
'''pop():随机删除一个元素,并返回此元素'''
set1 = {'alex','wusir','evj','taibai'}
res=set1.pop()
print(res)
print(set1)
'''clear():清空集合,保留集合本身'''
set1 = {'alex','wusir','evj','taibai'}
set1.clear()
print(set1)
>>> set() #谨记:空集合的写法为:set()
'''del语句 在内存级别删除集合本身'''
set1 = {'alex','wusir','evj','taibai'}
del set1
print(set1)
(3)集合的关系测试
#并集(| 或 union)
set1 = {1,2,3}
set2 = {4,5}
set3 = set1 | set2
print(set3)
set3 = set1.union(set2)
print(set3)
# 交集(& 或 intersection)
set1 = {1,2,3}
set2 = {3,4}
set3 = set1 & set2
print(set3)
# 反交集(^ 或 symmetric_difference)
set1 = {1,2,3}
set2 = {3,4}
set3 = set1.symmetric_difference(set2)
print(set3)
# 差集(- 或者 difference)
set1 = {1,2,3,4,5}
set2 = {1,2,3}
set3 = set1 - set2
print(set3)
set3 = set1.difference(set2)
print(set3)
#子集 <, issubset()
set1 = {1,2,3,4,5}
set2 = {1,2,3}
print(set2 < set1)
print(set2.issubset(set1))
#超集 >,issuperset()
二.深浅copy详解
事前须知:赋值的含义
l1 = [1,2,3]
l2 = l1
l1.append(666)
print(l2)
print(id(l1))
print(id(l2))
>>>
[1, 2, 3, 666]
2153377571720
2153377571720 #证明l1,l2在内存中指向的是同一个地址。所以l1改变,L2也会变。
(1)浅copy
l1 = [1,2,3]
l2 = l1.copy()
l1.append(666)
print(l1)
print(l2)
>>>
[1, 2, 3, 666]
[1, 2, 3]
****从上面的代码看,好像没有太大问题,接着往下看,神奇的事情发生了****
l1 = [1,2,3,[22]]
l2 = l1.copy()
l1[-1].append(666)
print(l1)
>>>[1, 2, 3, [22, 666]]
print(l2)
>>>[1, 2, 3, [22, 666]]
print(id(l1))
print(id(l2))
print(id(l1[0]))
print(id(l2[0]))
print(id(l1[-1]))
print(id(l2[-1]))
>>>
2233198322568
2233199144648
1964990688
1964990688
2233198322696
2233198322696
总结:
浅copy只是在第一层的内存地址是不同的,从第二层开始以及更深层,都是共用的一个内存地址。
(2)深copy
# 深copy需要用到copy模块中的deepcopy()方法
import copy
l1 = [1,2,3,[22]]
l2 = copy.deepcopy(l1)
l1.append(666)
print(l1)
print(l2)
>>>
[1, 2, 3, [22], 666]
[1, 2, 3, [22]]
import copy
l1 = [1,2,3,[22]]
l2 = copy.deepcopy(l1)
l1[-1].append(666)
print(l1)
print(l2)
>>>
[1, 2, 3, [22, 666]]
[1, 2, 3, [22]]
print(id(l1))
print(id(l2))
print(id(l1[-1]))
print(id(l2[-1]))
>>>
1590872594312
1590872595592
1590872594120
1590872595528
总结:
深copy的两个对象之间是完全独立的关系,两个对象的内存地址完全不一样。
(3)应用场景:
1.完全独立的copy一份数据,与原数据没有关系,就使用深copy。
2.如果有一份数据的第二层想与原数据进行共有,就使用浅copy。
(4)面试题:
一.解释深浅copy的含义。
二.完全切片[:]属于浅copy
l1 = [1,2,3,[22,33]]
l2 = l1[:]
# l1.append(66)
# print(l1)
# print(l2)
l1[-1].append(66)
print(l1)
>>> [1,2,3,[22,33,66]]
print(l2)
>>> [1,2,3,[22,33,66]]