69.集合的概述与创建
集合
Python语言提供的内置数据结构
与列表、字典一样都属于可变类型的序列
集合是没有value的字典
集合的创建方式
直接{}
s={'Python','hello',90}
使用内置函数set()
s=set(range(6))
print(s)
print(set([3,4,53,56]))
print(set((3,4,43,435)))
print(set('Python'))
print(set({124,3,4,4,5}))
print(set())
'''集合的创建方式'''
'''第一种创建方式使用{}'''
s={2,3,4,5,5,6,7,7} #集合中的元素不允许重复
print(s)
'''第二种创建方式使用set()'''
s1=set(range(6))
print(s1,type(s1)) #{0, 1, 2, 3, 4, 5} <class 'set'>
s2=set([1,2,3,3,4,5,5,6]) #{1, 2, 3, 4, 5, 6} <class 'set'>重复会删除
print(s2,type(s2))
s3=set((1,2,4,4,5,65)) #集合中的元素是无序的
print(s3,type(s3))
s4=set('python')
print(s4,type(s4)) #集合中的元素是无序的
'''定义一个空集合'''
s6={} #dict字典类型
print(type(s6))
s7=set()
print(type(s7)) #空集合
#结果
{2, 3, 4, 5, 6, 7}
{0, 1, 2, 3, 4, 5} <class 'set'>
{1, 2, 3, 4, 5, 6} <class 'set'>
{65, 1, 2, 4, 5} <class 'set'>
{'y', 'o', 'n', 'h', 't', 'p'} <class 'set'>
<class 'dict'>
<class 'set'>
进程已结束,退出代码0
70.集合的相关操作
集合元素的判断操作
in或 not in
集合元素的判断新增操作
调用add()方法,一次添加一个元素
调用update()方法至少添加一个元素
集合元素的删除操作
1.调用remove()方法,一次删除一个指定元素,如果指定的元素不存在抛出KeyError
2.调用discard()方法,一次删除一个指定元素,如果指定的元素不存在不抛出异常
3.调用pop()方法,一次只删除一个任意元素
4.调用clear()方法,清空集合
'''集合的相关操作'''
s={10,20,30,123,60}
'''集合元素的判断'''
print(10 in s) #10 在s里面吗 Ture
print(100 in s) #100 在s里面吗 False
print(10 not in s) #10 不在s里面吗 False
print(100 not in s) #100 不在s里面吗 True
'''集合元素的新增操作'''
s.add(80) #add一次添加一个元素
print(s)
s.update({200,400,300}) #添加字典 update至少添加一个元素
print(s)
s.update([100,99,56]) #添加列表
s.update((78,23,65)) #添加元组
print(s)
'''集合元素的删除操作'''
s.remove(123) #删除123
print(s)
#s.remove(500) #KeyError:500 因为没有100 所以报错
s.discard(300) #使用discard即使没有300,它也不会报错
print(s)
s.pop()
#s.pop(400) #TypeError: set.pop() takes no arguments (1 given) 不能添加参数
s.pop()
print(s)
s.clear() #清除所有元素
print(s)
#结果
True
False
False
True
{80, 20, 10, 123, 60, 30}
{200, 10, 300, 80, 400, 20, 123, 60, 30}
{65, 99, 100, 200, 10, 300, 78, 80, 400, 20, 23, 56, 123, 60, 30}
{65, 99, 100, 200, 10, 300, 78, 80, 400, 20, 23, 56, 60, 30}
{65, 99, 100, 200, 10, 78, 80, 400, 20, 23, 56, 60, 30}
{100, 200, 10, 78, 80, 400, 20, 23, 56, 60, 30}
set()
进程已结束,退出代码0
71.集合间的关系
两个集合是否相等
可以使用运算符==或!=进行判断
一个集合是否是另一个集合的子集
可以调用方法issubset进行判断
B是A的超集
两个集合是否没有交集
可以调用方法isdisjoint进行判断
'''两个集合是否相等(元素相同,就相等)'''
s={10,20,30,40}
s2={30,40,20,10}
print(s==s2) #True
print(s!=s2) #False
"""一个集合是否是另一个集合的子集"""
s1={10,20,30,40,50,60}
s2={10,20,30,40}
s3={10,20,90}
print(s2.issubset(s1)) #True
print(s3.issubset(s1)) #False
'''一个集合是否是另一个集合的超集'''
print(s1.issuperset(s2)) #True
print(s1.issuperset(s3)) #False
'''零个集合是否含有交集'''
print(s2.isdisjoint(s3)) #False 有交集为False
s4={100,200,300}
print(s2.isdisjoint(s4)) #False 没有交集为True
#结果
True
False
True
False
True
False
False
True
72.集合的数据操作
#集合的数学操作
'''交集'''
s1={10,20,30,40}
s2={20,30,40,50,60}
print(s1.intersection(s2))
print(s1 & s2) #intersection()与 & 等价,交集操作
print(s1)
print(s2)
'''并集操作'''
print(s1.union(s2))
print(s1|s2) #union与 | 等价,并集操作
print(s1)
print(s2)
'''差集操作'''
print(s1.difference(s2))
print(s1-s2)
print(s1)
print(s2)
'''对称差集'''
print(s1.symmetric_difference(s2))
print(s1^s2)
#结果
{40, 20, 30}
{40, 20, 30}
{40, 10, 20, 30}
{50, 20, 40, 60, 30}
{40, 10, 50, 20, 60, 30}
{40, 10, 50, 20, 60, 30}
{40, 10, 20, 30}
{50, 20, 40, 60, 30}
{10}
{10}
{40, 10, 20, 30}
{50, 20, 40, 60, 30}
{50, 10, 60}
{50, 10, 60}
73.集合的生成式
用于生成集合的公式
将{}修改为[]就是列表生成式^_^
没有元组生产式
'''列表生成式'''
lst=[ i*i for i in range(10)]
print(lst)
#集合生成式
s={i*i for i in range(10)}
print(s)
#结果
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
{0, 1, 64, 4, 36, 9, 16, 49, 81, 25}
74.字符串的创建与驻留机制
驻留机制的几种情况(交互模式)
字符串的长度为0或1时
符合标识符的字符串
字符串只在编译时进行驻留,而非运行时
[-5,256]之间的整数数字
sys中的intern方法强制2个字符串指向同一个对象
PyCharm对字符串进行了优化处理
,字符串驻留机制的优缺点 当需要值相同的字符串时,可以直接从字符串池里拿来使用,避免频繁的创建和销毁,提升效率和节约内存,因此拼接字符串和修改字符串是会比较影响性能的。 在需要进行字符串拼接时建议使用str类型的join方法,而非+ ,因为join()方法是先计算出所有字符中的长度,然后再拷贝,只new一次对象,效率要比"+"效率高.