Day-9 集合和字符串(总结)

本文主要介绍了Python中的集合和字符串。集合是可变容器,无序且元素唯一,支持增删改查操作以及数学集合运算如并集、交集、差集等。字符串是有序不可变容器,支持字符的获取和查找,以及转义字符和编码的概念。
摘要由CSDN通过智能技术生成

Day-9 集合和字符串

姚万里

1.集合

1.什么是集合(set)
  1. 集合是容器型数据类型;将{}作为容器的标志,里面多个元素用逗号隔开:{元素1, 元素2, 元素3,…}
  2. 可变的;无序
  3. 元素的要求:
    a.必须是不可变类型的数据
    b.元素是唯一的 (自动去重)
2.增删改查
  1. 查 - 只能遍历

  2. 增- 集合.add(元素) - 将元素添加到集合中

  3. 删- 集合.remove(元素) - 删除指定元素,元素不存在报错

    ​ 集合.discard(元素) - 删除指定元素,元素不存在不报错

    4.改 - 没有改的语法,如果要改就删除旧的,添加新的

2.数学集合运算

python中的集合支持的数学集合运算:并集(|)、交集(&)、差集(-)、对称差集(^)、子集(>=、<=)、真子集(>、<)

1.并集(|)

集合1 | 集合2 - 将两个集合合并产生一个新的集合

2.交集(&)

集合1 & 集合2 - 获取两个集合公共部分产生一个新的集合

3.差集(-)

集合1 - 集合2 - 获取集合1中没有包含在集合2中的元素,得到一个新的集合

集合2 - 集合1 - 获取集合2中没有包含在集合1中的元素,得到一个新的集合

4.对称差集(^)

集合1 ^ 集合2 - 两个集合合并去掉公共部分

5.子集和真子集

{1, 2, 3}的子集有:{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}、{1, 2, 3} - >=、<=
集合1 >= 集合2 - 判断集合2是否是集合1的子集
集合1 <= 集合2 - 判断集合1是否是集合2的子集

{1, 2, 3}的真子集有:{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}
集合1 > 集合2 - 判断集合2是否是集合1的真子集
集合1 < 集合2 - 判断集合1是否是集合2的真子集

print({1, 2, 3} > {0})      # False
print({1, 2, 3} > {1})      # True

3.认识字符串

1.什么是字符串(str)

1)字符串是容器型数据类型;将’’、""、""""""、’’’’’'作为容器的标志,里面的每一个符号就是它的一个元素。
2)字符串不可变;字符串有序
3)字符串元素:引号中的每一个符号都是字符串的元素,又叫字符。
字符分为普通字符和转义字符两种:
普通字符 - 在字符串中表示符号本身的字符

1.三个引号开头的字符串,字符串内容可以直接换行

str1 = 'abc'
str2 = "abc"
str3 = '''abc'''
str4 = """abc"""
print(type(str1), type(str2), type(str3), type(str4))
str6 = """床前明月光,
疑是地上霜;
举头望明月,
低头思故乡。"""
print(str6)

2.字符 - 字符串的元素

普通字符

str1 = 'abcMSK'
str2 = '123sh'
str3 = '数据上报'
str4 = '😊❀'
print(str4)

转义字符

str1 = '\tabc\n123\u4e00'
print(str1)

字符串有序

print('abc' == 'bac')   # False

4.转义字符

1.字符 - 字符串的每个元素

字符分为普通字符和转义字符

1.转义字符 - 在特定的一些符号前加\来表示特殊功能或者特殊意义的符号

常用的转义字符:
\n - 换行(相当于按回车)
\t - 水平制表符(相当于按tab键)
’ - 一个普通的单引号
" - 一个普通的单引号
\ - 一个普通的反斜杠

2.R语法

如果在字符串的最前面加r或者R可以让字符串中所有的转义字符功能消失,每个符号都会变成普通字符

str1 = R'\tabc\n123\'mn'
print(str1)    # \tabc\n123\'mn


str2 = 'abc\u5a5f'
print(str2)

5.字符编码

1.计算机存储数据的原理

计算机只具备存储数字的能力

2.字符编码

为了能够让计算机存储文字信息,给每一个符号对应了一个固定的数字,每次需要存储文字符号的时候就存储这个符号对应的数字。
这个数字就是这个符号编码值。

3.编码表 - 保存不同字符对应的编码值的表

1)ASCII码表
有128个符号(美国符号)
数字在大写字母的前面,大写字母在小写字母前面,大写字母和小写字母之间有间隙

2)Unicode编码表(Python)
Unicode编码表中包含了ASCII码表
Unicode包含了世界上所有的国家所有的民族的所有符号,又叫万国码
中文范围:4e00 ~ 9fa5

4.Python对编码值的使用

1.chr函数

chr(编码值) - 获取编码值对应的字符

print(chr(97))     # 'a'
print(chr(1000))   # 'Ϩ'
print(chr(0x9e00))      # '鸀'
打印所有中文
num = 0
for x in range(0x4e00, 0x9fa5+1):
    print(chr(x), end=' ')
    num += 1
    if num % 30 == 0:
        print()
print(num)

for x in range(0x1800, 0x18AF+1):
    print(chr(x), end=' ')

2.ord函数

ord(字符) - 获取字符对应的编码值

print(ord('余'), ord('婷'))

3.编码字符

\u4的16进制数 - 创建一个字符,字符就是4的16进制数作为编码值对应的字符

str1 = '\u0061\u4f59\u5a77'
print(str1)

x = '好'
print('\u4e00' <= x <= '\u9fa5')

5.字符串作为容器的操作

字符串不可变,所以只支持查操作
1.查 - 获取字符

字符串获取字符和列表获取元素对应的语法一模一样的

str1 = 'abc123'
print(str1[2], str1[-4])

print(str1[1:])    # 'bc123'
print(str1[1:-1:2])     # 'b1'
print(str1[3:1:2])      # ''

for x in str1:
    print('x:', x)

每一个有效转义字符的长度都是1

str2 = '\ta\u4e00bc\n123\\'
print(str2[1])
print(str2[3])

str2 = r'\ta\u4e00bc\n123\\'
print(str2[2])
print(str2[9])
2.in 和 not in

字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)

print('ab' in 'abc')        # True
print('a' in 'abc')         # True
print('ab' in 'acb')        # False
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值