集合和字符串
认识集合(set)
-
集合是容器型数据类型,将{}作为容器的标志里面多个数据用逗号隔开;{数据1, 数据2, 数据3, …} —— 数据不会重复,集合会自动去重
-
可变的(支持增删改查);无序(不支持下标操作)
-
元素的要求:
a. 必须是不可变的数据
b. 元素是唯一
# 空集合 set1 = set () # 集合是无序的 print({1,2,3} == {3,2,1}) # True # 集合元素必须是不可变类型的数据 set1={1,'abc',True,(1,2)} print(set1) # 不会报错 set2={1,'abc',True,[1,2]} print(set2) # 报错(元组改成列表) # 集合元素是唯一的 set3 = {10,20,10,20,30,10} print(set3) # {10,20,30}
集合的增删改查
-
查 —— 只能遍历
补充: 用for循环遍历无序序列的时候,系统在遍历之前自动将无序序列转换成列表,然后再遍历列表。
set1 = {'喜羊羊与灰太狼','黑猫警长','妖精的尾巴','海贼王'} for i in set1: print(i) #它可能不是按照集合里面的顺序输出,但是能全部输出出来
-
增 —— 添加元素
集合.add(元素) # 添加指定元素 集合.update(序列) # 将序列中所有元素添加到集合中
-
删
集合.remove(元素)
数学集合运算
-
python中使用的集合和数学集合是一个东西,并且支持数学集合运算
-
python支持的数学集合运算:交集 (&) 、并集( | ) 、差集( - ) 、对称差集( ^ )
子集 ( >= 、<=) 、 真子集( > 、<)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ObYfz2JP-1645707143927)(F:\截图/day091.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lLkhdyLf-1645707143929)(F:\截图/day092.png)]
set1 = {1,2,3,4,5}
set2 = {3,4,5,6,7,8}
print( set1 & set2 ) # {3,4,5}
print( set1 | set2 ) # {1,2,3,4,5,6,7,8}
print( set1 - set2 ) # {1,2}
print( set2 - set1 ) # {6,7,8}
print( set1 ^ set2 ) # {1,2,6,7,8}
# 子集和真子集
# 集合1 > 集合2 判断集合2是否是集合1的真子集
# 集合1 < 集合2 判断集合1是否是集合2的真子集
{1,2,3} #真子集 {}{1}{2}{3}{1,2}{1,3}{2,3}
{1,2,3} #子集 {}{1}{2}{3}{1,2}{1,3}{2,3}{1,2,3}
字符串(str)
-
字符串是容器型数据类型,将 ’ ’ 、" " 、’’’ ‘’’、""" “”"作为容器的标志,引号里面的一个字符都是字符的元素(字符串的元素又叫字符)
'10 20' #这代表5个元素: 1 0 空格 2 0
-
不可变(不支持增删改)
有序的(支持下标操作)
字符串的元素:一切符号都可以作为字符串的元素,字符串的元素又叫字符。
# 空串 str1 = '' #引号里面不能加空格!!!
-
字符 —— 字符串中每一个独立的符号就是一个字符
字符分为两种:普通字符和转义字符
# 普通字符 —— 表示符号本身的字符就是普通字符 # 转义字符 —— 具备特殊功能或者特殊意义的符号就是转义字符。所有的转义字符的通用格式:\X 、\xxxxx # 转义字符是通过\加普通字符构成的,但是不是所有的普通字符加\都可以变成转义字符 \n —— 换行 \t —— 水平制表符(相当于按一次tab键) \' —— 一个单引号 \" —— 一个双引号 \\ —— 一个反斜杠 \u —— 后面必须跟4位的十六进制数 编码字符(四位的十六进制数就是计算机里面的编码值)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5UoyY34g-1645707143930)(F:\截图\day093.png)]
所有的转义字符的长度都是 1
-
字符编码
计算机能够直接存储的数据只有数字,存数字的时候保存的是数字的补码
如果想要将非数字数据保存到计算机中,存储的时候一定会先将数据转换成数字。
如果需要存储的是文字,计算机会保存这个文字符号对应的编码值
-
编码值
每个文字符号(字符)在计算机中对应一个固定的数字,这个数字就是这个符号的编码值。
-
字符编码表 —— 记录每个符号和数字对应关系的表
常见的编码表:
a. ASCII 表
ASCII码表只有128个字符(不够用)
数字:0 - 9 # 48 - 57
字母:A - Z # 65 - 90
a - z # 97 - 122
b. Unicode编码表(Python) —— 是ASCII的扩展,里面包含ASCII码表
Unicode编码表包含了世界上所有的国家所有的民族的所有符号
中文编码范围:4e00 ~ 9fa5
-
编码在python中的应用
1)chr 函数:chr(编码值) —— 根据编码值获取对应的字符
程序中直接表示一个16进制数:加前缀 0x 或者 0X
2)ord 函数:ord(字符) —— 获取字符对应的编码值;字符 - 长度是1的字符串
3)编码字符:
中文编码范围:0x4e00 ~ 0x9fa5(16进制)
-
字符串常用操作:
1)查 —— 获取字符
字符串获取字符和列表获取元素的语言一模一样。
2)字符串相关操作
+ * str1 = 'abc' str2 = '123' print(str1+str2) # 'abc123' print(str1*3) # 'abcabcabc'
比较大小:< > <= >= ==
如果两个字符串比较大小,比较的是第一对不相等字符的编码值的大小;
应用:判断字符的性质
a. 判断字符是否是数字字符 ‘0’ <= x <= ‘9’
b. 判断字符是否是中文 ‘\u4e00’ <= x <= ‘\u9fa5’
3)in 和 not in
字符串1 in 字符串2 —— 判断字符串1是在字符串2中(判断字符串1是否是字符串2的子串)
字符串比较大小,比较的是第一对不相等字符的编码值的大小;
应用:判断字符的性质
a. 判断字符是否是数字字符 ‘0’ <= x <= ‘9’
b. 判断字符是否是中文 ‘\u4e00’ <= x <= ‘\u9fa5’
3)in 和 not in
字符串1 in 字符串2 —— 判断字符串1是在字符串2中(判断字符串1是否是字符串2的子串)