08元组集合和字符串-CSDN博客

本文链接：https://blog.csdn.net/u014267488/article/details/124329798

元组集合和字符串

review

1.什么是字典

# 1. 什么是字典(dict)
"""
容器；{键1:值1, 键2:值2, ...}
可变的; 无序的
键 - 不可变数据类型的数据; 唯一的
值 - 任何数据
"""
# {}  -  空字典

# 2. 查
# 1)查单个
"""
字典[键]
字典.get(键)
字典.get(键, 默认值/返回值)
"""

# 2)遍历
"""
for 键 in 字典:
    pass
    
"""
# dict1 = {'a': 10, 'b': 20, 'c': 30}

# 3. 增、改
"""
字典[键] = 值

字典.setdefault(键, 值)
"""

# 4. 删
"""
del 字典[键]
字典.pop(键)
"""

# 5.操作
# in 和 not in


# clear()把原字典都删掉
# get   key values items pop
# update  增加
# 6.函数
# len、dict
# clear()把原字典都删掉
# get   key values items pop
# update  增加

元组

# 1) 什么是元组(tuple)
"""
容器:将()作为容器得标记,里面多个元素用逗号隔开:(元素1,元素2,元素3,...)
不可变得;有序得(直接下标操作)
元素: 任何元素
"""

# 空元组
t1 = ()
# 没有意义 t1开始空得永远事空得

# 只有一个元素得元组  - 唯一得这个元素后面必须加逗号
t2 = (100,)
print(t2, type(t2), len(t2))
# (100,) <class 'tuple'> 1

# 在没有歧义得情况下,元组得()得可以省略
t3 = (10, 20, 30) * 3
print(t3)
#
# (10, 20, 30, 10, 20, 30, 10, 20, 30)

t4 = 10, 20, 30 * 3  # 直接将多个数据用逗号隔开,表示得也是一个元组
print(t4)
# (10, 20, 90)

# 2) 元组就是不可变得列表
# 列表中除了和可变相关得操作,其他操作元组都支持

t3 = (5, 6, 7)
# t3.append(5)
# AttributeError: 'tuple' object has no attribute 'append'

t3 = list(t3)
print(t3)
# [5, 6, 7]

t3 = tuple(t3)
print(t3)
# (5, 6, 7)

集合

# 2。集合
# 1) 什么是集合(set)
"""
容器:将{}作为容器得标志,里面多个元素用逗号隔开:{元素1,元素2,元素3,...}
可变得;无序得
元素得要求:和字典对键得要求一样 (不可变的数据;唯一得)

"""

# 空集合
s1 = set()
print(type(s1), len(s1))  # <class 'set'> 0

# 元素是不可变类型的数据
s2 = {10, 'abc', (1, 2)}
print(s2)

# s3 = {10, 'abc', [1, 2]}  # TypeError: unhashable type: 'list'

# 集合元素是唯一的 - 去重

s3 = {10, 20, 10, 10, 30, 20}
print(s3)  # {10,20,30}

# 2) 数学集合运算: &(交集) , |(并集), - (差集), ^ (对称差集), > < >= <=

# A - B 去掉B中A包含的部分

# A ^ B
# &（交集） - 集合1 & 集合2     -   获取两个集合的公共部分
s1 = {1, 2, 3, 4, 5, 6, 7}
s2 = {5, 6, 7, 8, 9, 10}

# &（交集） - 集合1 & 集合2     -   获取两个集合的公共部分
print(s1 & s2)  # {5,6,7}

# 集合1 | 集合2 - 合并两个集合
print(s1 | s2)  # {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

# 集合1 - 集合2
print(s1 - s2)  # {1,2,3,4}
print(s2 - s1)  # {8,9,10}

# 集合1 ^ 集合2
print(s1 ^ s2)  # {1,2,3,4,8,9,10}

# >,<,    - 判断是否是真子集
# 集合1 > 集合2   -  集合2是否是集合1的真子集

# s1.append(15)
# print(s1)
# AttributeError: 'set' object has no attribute 'append'

"""
{1, 2, 3}
子集：{}、{1}, {2}, {3}、{1, 2}、{1, 3}、{2, 3}、{1, 2, 3}
真子集：{}、{1}, {2}, {3}、{1, 2}、{1, 3}、{2, 3}
"""
# >、<  -   判断是否是真子集
# 集合1 > 集合2   -  集合2是否是集合1的真子集

# >=、<=  - 判断是否是子集

认识字符串

# 1. 什么是字符串(str)
"""
字符串是容器型数据类型；将''、""、''''''、""""""作为容器的标志，引号中的每个符号就是字符串的元素
字符串是不可变的；字符串有序(支持下标操作),
元素：引号中的每个符号就是字符串的元素，字符串的元素又叫字符。字符分为普通字符和转义字符两种
"""

# 1) 引号中的每个符号都是字符串的元素，对于符号本身没有限制

str1 = 'abc23红色经典mn*……😁❀♥'

# 2) 引号问题
str2 = 'abc'
str3 = "abc"
str4 = '''abc'''
str5 = """abc"""
# 输出结果都是abc
str4 = ' ''abc'' '
#  abc 
str5 = "" " abc " ""
#  abc  和上面字符一样  最外面引号没意义，只
print(type(str2), type(str3), type(str4), type(str5))       # <class 'str'> <class 'str'> <class 'str'> <class 'str'>

# 3）多行字符串  -  三个引号开头的字符串，字符串内容可以直接按回车换行
str1 = '''abc
123
MN'''
print(str1)

# 4)空串
str1 = ""
str1 = ""
str1 = """ """
print(len(str1), type(str1))

字符和字符编辑转义字符

# 1.字符
'a'
"ab"

"""
1) 普通字符 - 在字符串中表示符号本身得字符就是普通字符,例如:中文,字母,数字等
    不是转义字符就是普通字符

2) 转义字符  - 在特定的符号前加\来表示特殊功能或者特殊意义的符号就是转义字符
\t  -  水平制表符(相当于按一个tab键)
\n  -  换行
\"  -  表示一个普通的单引号
\'  -  表示一个普通的双引号
\\  -  表示一个普通的反斜杠
"""

print('\tabc\n123')
#  abc
# 123
print('abc\n123')
# abc
# 123
print("it's me")
# print('it's me') # 报错
print('it\'s me')
print("I say\":you see see , one day day \" ")
print('I say":you see see , one day day "')

print('\\tabc')   # 反斜杠
# \tabc

# 2.R语法
"""
字符串的最前面可以加r或者R,让字符串所有的转义字符失效,所有的符号都编程普通字符
r'' , R''
"""

str1 = '\tabc\n123\u4e00'
print(str1)
#	 abc
# 123一 u4e00是汉字的一
str2 = r'\tabc\n123\u4e00'
print(str2)
# \tabc\n123\u4e00

path = r'C:\users\yuting\test\demo\a.txt'
print(path)
# C:\users\yuting\test\demo\a.txt

字符编码问题

# 1.字符编码
"""
计算机只能存储数据
计算机保存数据的时候只能存数字,而且存的是数字的补码

字符编码:为了能够让计算机保存文字符号,我们给每一个符号对应一个固定的数字,
    在存储符号的时候就保存这个符号对应的主子,那么这个数字就是这个符号的编码值

"""

# 78 ->  1001110  ->   01001110一个字节8位  可以存储
# -79 -> 11001110 ->  反码10110001 -> 加1 补码10110010

# 2.编码表 - 保存符号和编码值对应关系的标

"""
1) ASCII码表:通过一个字节来对128个字符进行编码,里面的字符是美国通用的符号
        数字在大写字母得前面.大写字母在小写字母的前面,大小字母和小写字母之间
        (A - 65;a-97)
        编码太少了
    
1967年

2) Unicode编码表(python):
    包含了世界上所有的国家所有民族的所有的语言的符号 (万国码)
    a.Unicode编码表是ASCII码表得扩展,它包含ASCII码表
    b.中文编码值范围:4e00 - 9fa5

# 3.python中使用编码值

# 1)chr函数:chr(编码值) - 获取编码值对应得字符

print(chr(0x4e00))

count = 0
for x in range(0x4e00, 0x9fa5 + 1):
    count += 1
    print(chr(x), end='')
    if count % 40 == 0:
        print()

print("------------------------华丽的下划线--------------------------")
count = 0
for x in range(0x1800, 0x18AF + 1):
    count += 1
    print(chr(x), end='')
    if count % 40 == 0:
        print()

# 2）ord函数: ord(字符)  -  获取指定字符对应的编码值

print(ord('余'), ord('婷'))       # 20313 23159
print(ord('钱'))     # 38065

# hex(十进制数)  -  获取指定十进制对应的16进制

print(hex(20313), hex(23159))       # 0x4f59 0x5a77

# 3）编码字符: 在字符串中用'\u4位的16进制编码值'来表示一个字符

str1 = 'a\u0061一\u4e00'
print(str1)

x = '一'
print('\u4e00' <= x <= '\u9fa5')
# True

# 字符串是容器不可变

获取字符

# 查 - 获取元素(字符)
# 列表获取元素的方法字符串都支持

str1 = '\thello world!'

# 注意:一个转义字符长度是1,一个空格的长度也是1

print(str1[2])  # 'e'
print(str1[-1])  # '!'

print(str1[1:4])  # hel

str2 = 'hajsks'
print(str2[1:-1])  # ajsk
print(str2[1:])  # ajsks

print("------------------------华丽的下划线--------------------------")
str3 = 'abc123'
for x in str3:
    print(x)
"""
a
b
c
1
2
3
"""

print("------------------------华丽的下划线--------------------------")
for index in range(len(str3)):
    print(index, str3[index])
    
"""
0 a
1 b
2 c
3 1
4 2
5 3
"""

# 2.相关操作

# 1) +,*

# 字符串1 + 字符串2  - 将两个字符串合并成一个字符串
str1 = 'hello'
str2 = 'python'
str3 = str1 + str2
print(str3)  # hellopython

# 字符串 * N , N * 字符串 - 将N个字符串合并成一个字符串

print(str1 * 3)  # hellohellohello

# 2) 比较大小: >, >= ,<=,<

# 两个字符串比较大小比较的是第一队不相等的字符的编码值大小
print('abc' < '1234567890')  # False
# 比的是a 和 1的大小
# 两个字符比较大小就是i叫两个字符的编码值大小
print('abc' < 'Z234567890')  # False
print('abc' < 'b234567890')  # True

"""
是否是数字:'0' <= x <= '9'
是否是小写字母: 'a' <= x <= 'z'
是否是字母: 'a' <=x <= 'z' or 'A' <=x <='Z'
是否是中文:'\u4e00' <= x <= '\u9fa5'
"""

# 练习1:已知一个字符串,统计字符串中数字字符的个数

str1 = 'abc1123你好110'
count = 0
for i in str1:
    if '0' <= i <= '9':
        count += 1
print(count)

# 练习2:已经一个字符串.提取字符串所有的中文字符

str1 = 'ab啊c1123你好110是-2=2'  # '啊你好是'
new_str = ''
for i in str1:
    if '\u4e00' <= i <= '\u9fa5':
        new_str += i
print(new_str)

# 3) in 和 not in

# 字符串1 in 字符串2 - 判断字符串2是否包含字符串1(判断字符串1是否是字符串2的子串)
print('a' in 'abc')  # True
print('ab' in 'abc')  # True
print('ac' in 'abc')  # False
print('abc' in 'abc')  # True
# 'abc' 的子串  a b c ab bc abc

# 'abc'的字串： ''、'a'、'b'、'c'、'ab'、'bc'、'abc'

08元组集合和字符串

元组集合和字符串

1.什么是字典

元组

集合

认识字符串

字符和字符编辑 转义字符

字符编码问题

获取字符

字符和字符编辑转义字符