一:集合
1.什么是集合(set)
1)集合是容器性数据类型;将{}作为容器的标志,里面多个元素用逗号隔开:{元素1,元素2,元素3,…}
2)可变的;无序
3)元素的要求:
a.必须是不可变类型的数据
b.元素是唯一的(自动去重)
#空集合
s1=set()
print(len(s1),type(s1)) #0 <class 'set'>
#集合无序
print({10,20,30}=={30,20,10}) #True
#元素是不可变类型的数据
s2={10,'abc',23.9,(1,2)}
print(s2)
#s3={10,'abc',23.9,[1,2]} #报错!TypeError: unhashable type: 'list'
#元素是唯一的
s4={10,20,10,10,30,30}
print(s4) #{10, 20, 30}
2.增删改查(了解)
1)查-只能遍历
s5={29,80,56,324}
for x in s5:
print('x:',x)
2)增
#集合.add(元素) - 将元素添加到集合中
s5.add(100)
print(s5) #{100, 324, 80, 56, 29}
3)删
#集合.remove(元素) - 删除指定元素,元素不存在报错
#集合,discard(元素)- 删除指定元素,元素不存在不报错
s5.remove(80)
print(s5) #{100, 324, 56, 29}
s5.discard(56)
print(s5) #{100, 324, 29}
#s5.discard(200)
#s5.remove(200) #报错!
4)改 - 没有改的语法,如果要改只有先删除再添加
二:数学集合运算
python中的集合支持的数学运算:并集(|)、交集(&)、差集(-),对称子集(^)、子集(>=、<=)、真子集(>、<)
A={1,2,3,4,5,6,7}
B={5,6,7,8,9}
1.并集(|)
#集合1|集合2 - 将两个集合合并产生一个新的几个
print(A|B) #{1,2,3,4,5,6,7,8,9}
2.交集(&)
#集合1&集合2 - 获取两个集合公共部分产生一个新的集合
print(A&B) #{5, 6, 7}
3.差集(-)
#集合1-集合2 - 获取集合1中没有包含在集合2中的元素,得到一个新集合
#集合2-集合1 - 获取集合2中没有包含在集合1中的元素,得到一个新集合
print(A-B) #{1, 2, 3, 4}
print(B-A) #{8, 9}
4.对称差集(^)
#集合1^集合2 - 两个集合合并去掉公共部分
print(A^B) #{1, 2, 3, 4, 8, 9}
5.子集和真子集
集合1>=集合2 -判断集合2是否是集合1的子集
集合1<=集合2 -判断集合1是否是集合2的子集
集合1>集合2 -判断集合2是否是集合1的真子集
集合1<集合2 -判断集合1是否是集合2的真子集
print({1,2,3}>{0}) #False
print({1,2,3}>{1}) #True
三:认识字符串
1.什么是字符串(str)
1)字符串是容器性数据类型;将’’、""、""""""、’’’’’'作为容器的标志,里面的每个符号就是它的一个元素
2)字符串不可变;字符串有序
3)字符串元素:引号中的每个符号都是字符串的元素,又叫字符。
字符分给普通字符和转义字符两种:
普通字符 - 在字符中表示符号本身的字符
三个引号开头的字符串,内容可以直接换行。
2)字符串的元素
#1普通字符
str1='abcMSk'
str2='123sh'
str3='钢铁侠'
str4='😊'
2#转义字符
str1='\tabc\n123
四:转义字符
1.字符 - 字符串的每个元素
字符分为普通字符和转义字符
1)转义字符 - 在特定的一些符号前加\来表示特殊功能或者特殊意义的符号
常用的转义字符:
\n - 换行(相当于按回车)
\t - 水平制表符(相当于按tab键)
\' - 一个普通的单引号
\" - 一个普通的双引号
\\ - 一个普通的反斜杠
#\u4位的16进制数 - 编码字符
print('\tabc\n123')
str1='it\'ok'
print(str1)
2)R语法
如果在字符串的最前面加r或者R可以让字符串中的所有的转义字符功能消失,每个符号都变成普通字符
print(r'\tabc\n123')
str2='abc\u5a5f'
print(str2)
五:字符编码
1.计算机存储数据的原理
计算机只具备存储数字的能力
2.字符编码
为了让计算机存储文字信息,给每个符号对应了一个固定的数字,每次需要存储文字符号的时候就储存这个符号对应的数字。
这个数字就是这个符号的编码值。
3.编码表-保存不同字符对应的编码值的表
1)ASCII码表
有128个符号(美国符号)
数字在大写字母前面,大写字母在小写字母前面,大写字母和小写字母之间有间隙
2)Unicode编码表(Python)
Unicode编码表中包含ASCII码表
Unicode包含了世界上所以的国家所有的民族的所有符号,又叫万国码
中文范围:4e00~9fa5
4.Python对编码值的使用
1)chr函数
chr(编码值) - 获取编码值对应的字符
print(chr(97)) #a
print(chr(9999)) #✏
print(chr(0x4e56)) #乖
#打印所有中文
# num=0
# for x in range(0x4e00,0x9fa5+1):
# print(chr(x),end='')
# num+=1
# if num%30==0:
# print()
# print(num)
2)ord函数 - 获取字符对应的编码值
print(ord('陈'),ord('俊'),ord('睿'))# 38472 20426 30591
3)编码字符
\u4的16进制数 - 创建一个字符,字符就是4的16进制数作为编码值对应的字符
六:字符串作为容器
字符串不可变,所以只支持查操作
1.查-获取字符
字符串获取字符和列表获取元素对应的语法一模一样的
str1='abc123'
print(str1[2],str1[-4])
print(str1[-1])
print(str1[1:-1:2])
print(str1[3:1:2])
for x in str1:
print('x',x)
每一个转义字符的长度都是1
str2='\ta\u4e00bc\n123\\'
2.in和not in
#字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('ab’in ‘abc’)
print('a’in ‘abc’)
print('ab’in ‘acb’)