Python-集合与字符串-day09

最新推荐文章于 2023-03-24 21:38:46 发布

小王胖了嘛

最新推荐文章于 2023-03-24 21:38:46 发布

阅读量581

点赞数

文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/mjh990403/article/details/123120815

版权

集合和字符串

认识集合（set）

集合是容器型数据类型，将{}作为容器的标志里面多个数据用逗号隔开；{数据1, 数据2, 数据3, …} —— 数据不会重复，集合会自动去重
可变的（支持增删改查）；无序（不支持下标操作）

元素的要求：

a. 必须是不可变的数据

b. 元素是唯一

# 空集合
set1 = set ()

# 集合是无序的
print({1,2,3} == {3,2,1})			# True

# 集合元素必须是不可变类型的数据
set1={1,'abc',True,(1,2)}
print(set1)							# 不会报错

set2={1,'abc',True,[1,2]}
print(set2)							# 报错(元组改成列表)

# 集合元素是唯一的
set3 = {10,20,10,20,30,10}
print(set3) 						# {10,20,30}

集合的增删改查

查 —— 只能遍历

补充：用for循环遍历无序序列的时候，系统在遍历之前自动将无序序列转换成列表，然后再遍历列表。

set1 = {'喜羊羊与灰太狼','黑猫警长','妖精的尾巴','海贼王'}
for i in set1:
    print(i)                    #它可能不是按照集合里面的顺序输出，但是能全部输出出来

增 —— 添加元素

集合.add(元素)		# 添加指定元素
集合.update(序列)	# 将序列中所有元素添加到集合中

删
```
集合.remove(元素)
```

数学集合运算

python中使用的集合和数学集合是一个东西，并且支持数学集合运算
python支持的数学集合运算：交集 (&) 、并集( | ) 、差集( - ) 、对称差集( ^ )

子集 ( >= 、<=) 、真子集( > 、<)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ObYfz2JP-1645707143927)(F:\截图/day091.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lLkhdyLf-1645707143929)(F:\截图/day092.png)]

set1 = {1,2,3,4,5}
set2 = {3,4,5,6,7,8}
print( set1 & set2 )		# {3,4,5}
print( set1 | set2 )		# {1,2,3,4,5,6,7,8}
print( set1 - set2 )		# {1,2}
print( set2 - set1 )		# {6,7,8}
print( set1 ^ set2 )		# {1,2,6,7,8}

# 子集和真子集 
# 集合1 > 集合2		判断集合2是否是集合1的真子集
# 集合1 < 集合2		判断集合1是否是集合2的真子集
{1,2,3} 		 #真子集 {}{1}{2}{3}{1,2}{1,3}{2,3}
{1,2,3} 		 #子集 {}{1}{2}{3}{1,2}{1,3}{2,3}{1,2,3}

字符串（str）

字符串是容器型数据类型，将 ’ ’ 、" " 、’’’ ‘’’、""" “”"作为容器的标志，引号里面的一个字符都是字符的元素（字符串的元素又叫字符）
```
'10 20'				 #这代表5个元素: 1 0 空格 2 0
```
不可变（不支持增删改）

有序的（支持下标操作）

字符串的元素：一切符号都可以作为字符串的元素，字符串的元素又叫字符。
```
# 空串
str1 = '' 		 #引号里面不能加空格！！！
```

字符 —— 字符串中每一个独立的符号就是一个字符

字符分为两种：普通字符和转义字符

# 普通字符 —— 表示符号本身的字符就是普通字符
# 转义字符 —— 具备特殊功能或者特殊意义的符号就是转义字符。所有的转义字符的通用格式：\X 、\xxxxx
# 转义字符是通过\加普通字符构成的，但是不是所有的普通字符加\都可以变成转义字符
\n —— 换行
\t —— 水平制表符（相当于按一次tab键）
\' —— 一个单引号
\" —— 一个双引号
\\ —— 一个反斜杠
\u —— 后面必须跟4位的十六进制数 编码字符（四位的十六进制数就是计算机里面的编码值）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5UoyY34g-1645707143930)(F:\截图\day093.png)]

所有的转义字符的长度都是 1

字符编码

计算机能够直接存储的数据只有数字，存数字的时候保存的是数字的补码

如果想要将非数字数据保存到计算机中，存储的时候一定会先将数据转换成数字。

如果需要存储的是文字，计算机会保存这个文字符号对应的编码值
编码值

每个文字符号（字符）在计算机中对应一个固定的数字，这个数字就是这个符号的编码值。
字符编码表 —— 记录每个符号和数字对应关系的表

常见的编码表：

a. ASCII 表

ASCII码表只有128个字符（不够用）

数字：0 - 9 # 48 - 57

字母：A - Z # 65 - 90

a - z # 97 - 122

b. Unicode编码表（Python） —— 是ASCII的扩展，里面包含ASCII码表

Unicode编码表包含了世界上所有的国家所有的民族的所有符号

中文编码范围：4e00 ~ 9fa5
编码在python中的应用

1）chr 函数：chr(编码值) —— 根据编码值获取对应的字符

程序中直接表示一个16进制数：加前缀 0x 或者 0X

2）ord 函数：ord(字符) —— 获取字符对应的编码值；字符 - 长度是1的字符串

3）编码字符：

中文编码范围：0x4e00 ~ 0x9fa5（16进制）
字符串常用操作：

1）查 —— 获取字符

字符串获取字符和列表获取元素的语言一模一样。

2）字符串相关操作
```
+ *
str1 = 'abc'
str2 = '123'
print(str1+str2)		# 'abc123'
print(str1*3)			# 'abcabcabc'
```
比较大小：< > <= >= ==

如果两个字符串比较大小，比较的是第一对不相等字符的编码值的大小；

应用：判断字符的性质

a. 判断字符是否是数字字符 ‘0’ <= x <= ‘9’

b. 判断字符是否是中文 ‘\u4e00’ <= x <= ‘\u9fa5’

3）in 和 not in

字符串1 in 字符串2 —— 判断字符串1是在字符串2中（判断字符串1是否是字符串2的子串）