2020_9_29_集合和字符串

集合(set)

集合是容器型数据类型, 将{}作为容器的标志里面多个元素用逗号隔开:{元素1,元素2,元素3,…}
可变的;无序的
元素:不可变的数据;唯一的

x = {} # 空字典
s1 = set() # 空集合

s3 = {10, ‘abc’, [1, 2]} # TypeError: unhashable type: ‘list’

元素是唯一的
s4 = {10, 20, 30, 10, 10}
print(s4) # {10, 20, 30}

集合是无序的
print({1, 3, 5} == {5, 1, 3}) # True

集合的增删改查

补充:通过for循环遍历无序序列的时候,都是先将序列转换成列表,然后遍历列表


集合只能遍历


集合.add(元素) - 在集合中添加指定元素
集合.update(序列) - 将序列中所有的元素添加到集合中


集合.remove(元素) - 删除集合中指定的元素(元素不存在会报错)
集合.discard(元素) - 删除集合中指定的元素(元素不存在不会报错)


先删除原来的,再添加新的

python中的集合支持数学中的集合运算:&(交集)、|(并集)、-(差集)、^(对称差集)、 >、<、>=, <=(判断包含关系)

字符串(str)

字符串是容器型数据类型,将’’、""、’’’’’’、""""""作为容器的标志里面的每一个基本符号就是字符串的元素
字符串是不可变的(不支持增删改)
字符串是有序的(支持下标操作)
元素:引号里面的每个基本单元就是字符串的元素,又叫字符(python中只有字符的概念没有字符对应的类型,一般直接使用长度是1的字符串来表示字符)

空串
s1 = ‘’
s2 = “”
s3 = ‘’’’’’
s4 = “”""""

‘’、"" 与 ‘’’’’’、"""""“的区别
‘’、”" - 字符串中不能直接换行

字符串有序

普通字符
除了转义字符以外的字符都是普通字符,普通字符在字符串中表示这个符号本身,包括:汉字、数字、字母、符号、表情符号等…
‘shdj’、‘收到货积分’、‘shd23’、’%……&*(’、‘🙂😿❀’

转义字符
在特定的一个或者多个符号前加\让符号具有特殊功能或者特殊意义。那么这种带有\字符就是转义字符:
\n - 换行
\t - 水平制表符(相当于按一下tab键)
’ - 表示一个普通的单引号
" - 表示一个普通的双引号
\ - 表示一个普通的反斜杠
注意:任意一个转义字符长度都是1

特殊的转义字符-编码字符:\u四位的十六进制数 - 表示16进制数对应的编码值对应的字符

字符编码

1)什么是字符编码
计算机在存储数据的时候只能存数字(存的数字二进制补码),为了能够让计算机存储字符,我们给每一个字符都对应一个固定的数字,那么每个字符对应的固定的数字就是这个字符的编码值

2)字符编码表 - 记录字符和数字之间一一对应关系的表就是字符编码表
常见的字符编码表有两种:ASCII码表、Unicode编码表(python采用的是Unicode编码表)
a. ASCII码表
ASCII码表总共有128个字符对应的编码,主要包含的是美国的通用符号其中包括:英文标点符号、数字字符、字母字符以及其他的一些符号
ASCII码表中,数字字符在字母的前面,大写字母在小写字母的前面,大写字母和小写字母之间有间接

b. Unicode编码表
Unicode编码表包含ASCII码表
中文编码范围:4e00 ~ 9fa5

编码字符: \u4位的16进制编码值

chr(编码值) - 获取编码值对应的字符

ord(字符) - 获取字符对应的编码值(返回的是十进制数)

字符串操作

获取字符

字符串获取字符和列表获取元素的方法一样

获取单个字符
字符串[下标]

字符串切片
字符串[:]

遍历

加法和乘法

print(‘abc’ + ‘123’) # ‘abc123’
print(‘you see see you!’ + ‘one day day!’) # ‘you see see you!one day day!’
print(‘abc’*3) # ‘abcabcabc’

比较大小

两个字符串比较大小:比较第一对不相等的字符编码值的大小

©️2020 CSDN 皮肤主题: 数字20 设计师:CSDN官方博客 返回首页