Day-9 集合和字符串
姚万里
1.集合
1.什么是集合(set)
- 集合是容器型数据类型;将{}作为容器的标志,里面多个元素用逗号隔开:{元素1, 元素2, 元素3,…}
- 可变的;无序
- 元素的要求:
a.必须是不可变类型的数据
b.元素是唯一的 (自动去重)
2.增删改查
-
查 - 只能遍历
-
增- 集合.add(元素) - 将元素添加到集合中
-
删- 集合.remove(元素) - 删除指定元素,元素不存在报错
集合.discard(元素) - 删除指定元素,元素不存在不报错
4.改 - 没有改的语法,如果要改就删除旧的,添加新的
2.数学集合运算
python中的集合支持的数学集合运算:并集(|)、交集(&)、差集(-)、对称差集(^)、子集(>=、<=)、真子集(>、<)
1.并集(|)
集合1 | 集合2 - 将两个集合合并产生一个新的集合
2.交集(&)
集合1 & 集合2 - 获取两个集合公共部分产生一个新的集合
3.差集(-)
集合1 - 集合2 - 获取集合1中没有包含在集合2中的元素,得到一个新的集合
集合2 - 集合1 - 获取集合2中没有包含在集合1中的元素,得到一个新的集合
4.对称差集(^)
集合1 ^ 集合2 - 两个集合合并去掉公共部分
5.子集和真子集
{1, 2, 3}的子集有:{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}、{1, 2, 3} - >=、<=
集合1 >= 集合2 - 判断集合2是否是集合1的子集
集合1 <= 集合2 - 判断集合1是否是集合2的子集
{1, 2, 3}的真子集有:{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}
集合1 > 集合2 - 判断集合2是否是集合1的真子集
集合1 < 集合2 - 判断集合1是否是集合2的真子集
print({1, 2, 3} > {0}) # False
print({1, 2, 3} > {1}) # True
3.认识字符串
1.什么是字符串(str)
1)字符串是容器型数据类型;将’’、""、""""""、’’’’’'作为容器的标志,里面的每一个符号就是它的一个元素。
2)字符串不可变;字符串有序
3)字符串元素:引号中的每一个符号都是字符串的元素,又叫字符。
字符分为普通字符和转义字符两种:
普通字符 - 在字符串中表示符号本身的字符
1.三个引号开头的字符串,字符串内容可以直接换行
str1 = 'abc'
str2 = "abc"
str3 = '''abc'''
str4 = """abc"""
print(type(str1), type(str2), type(str3), type(str4))
str6 = """床前明月光,
疑是地上霜;
举头望明月,
低头思故乡。"""
print(str6)
2.字符 - 字符串的元素
普通字符
str1 = 'abcMSK'
str2 = '123sh'
str3 = '数据上报'
str4 = '😊❀'
print(str4)
转义字符
str1 = '\tabc\n123\u4e00'
print(str1)
字符串有序
print('abc' == 'bac') # False
4.转义字符
1.字符 - 字符串的每个元素
字符分为普通字符和转义字符
1.转义字符 - 在特定的一些符号前加\来表示特殊功能或者特殊意义的符号
常用的转义字符:
\n - 换行(相当于按回车)
\t - 水平制表符(相当于按tab键)
’ - 一个普通的单引号
" - 一个普通的单引号
\ - 一个普通的反斜杠
2.R语法
如果在字符串的最前面加r或者R可以让字符串中所有的转义字符功能消失,每个符号都会变成普通字符
str1 = R'\tabc\n123\'mn'
print(str1) # \tabc\n123\'mn
str2 = 'abc\u5a5f'
print(str2)
5.字符编码
1.计算机存储数据的原理
计算机只具备存储数字的能力
2.字符编码
为了能够让计算机存储文字信息,给每一个符号对应了一个固定的数字,每次需要存储文字符号的时候就存储这个符号对应的数字。
这个数字就是这个符号编码值。
3.编码表 - 保存不同字符对应的编码值的表
1)ASCII码表
有128个符号(美国符号)
数字在大写字母的前面,大写字母在小写字母前面,大写字母和小写字母之间有间隙
2)Unicode编码表(Python)
Unicode编码表中包含了ASCII码表
Unicode包含了世界上所有的国家所有的民族的所有符号,又叫万国码
中文范围:4e00 ~ 9fa5
4.Python对编码值的使用
1.chr函数
chr(编码值) - 获取编码值对应的字符
print(chr(97)) # 'a'
print(chr(1000)) # 'Ϩ'
print(chr(0x9e00)) # '鸀'
打印所有中文
num = 0
for x in range(0x4e00, 0x9fa5+1):
print(chr(x), end=' ')
num += 1
if num % 30 == 0:
print()
print(num)
for x in range(0x1800, 0x18AF+1):
print(chr(x), end=' ')
2.ord函数
ord(字符) - 获取字符对应的编码值
print(ord('余'), ord('婷'))
3.编码字符
\u4的16进制数 - 创建一个字符,字符就是4的16进制数作为编码值对应的字符
str1 = '\u0061\u4f59\u5a77'
print(str1)
x = '好'
print('\u4e00' <= x <= '\u9fa5')
5.字符串作为容器的操作
字符串不可变,所以只支持查操作
1.查 - 获取字符
字符串获取字符和列表获取元素对应的语法一模一样的
str1 = 'abc123'
print(str1[2], str1[-4])
print(str1[1:]) # 'bc123'
print(str1[1:-1:2]) # 'b1'
print(str1[3:1:2]) # ''
for x in str1:
print('x:', x)
每一个有效转义字符的长度都是1
str2 = '\ta\u4e00bc\n123\\'
print(str2[1])
print(str2[3])
str2 = r'\ta\u4e00bc\n123\\'
print(str2[2])
print(str2[9])
2.in 和 not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('ab' in 'abc') # True
print('a' in 'abc') # True
print('ab' in 'acb') # False