day 8 - 元组、集合和字符串

最新推荐文章于 2024-08-06 17:45:33 发布

tyd1320836926

最新推荐文章于 2024-08-06 17:45:33 发布

阅读量97

点赞数

文章标签： python

本文链接：https://blog.csdn.net/tyd1320836926/article/details/124372250

版权

day 8 - 元组、集合和字符串

1. 元组和集合

1. 元组

a. 什么是元组（tuple）

"""
容器; 将()作为容器的标志，里面多个元素用逗号隔开：(元素1, 元素2, 元素3, ...)
不可变的(不支持增删改); 有序的(支持下标操作)
元素：任何数据
"""

b. 空元组

t1 = ()

c . 只有一个元素的元组(重点!) - 唯一的这个元素后面必须加逗号

t2 = (100,)
print(t2, type(t2), len(t2))

d. 在没有歧义的情况下，元组的()可以省略 - 直接将多个数据用逗号隔开，表示的也是一个元组

t3 = 10, 20, 30 * 3
print(t3)            # (10, 20, 90)

e. 元组就是不可变的列表

注意：列表中除了和可变相关的操作，其它元组都支持

2. 集合

a. 什么是集合（set）

"""
容器；将{}作为容器的标志，里面多个元素用逗号隔开：{元素1, 元素2, 元素3,...}
可变的；无序的
元素的要求：和字典对键的要求一样（不可变的数据; 唯一的）
"""

b. 空集合

s1 = set()
print(type(s1),  len(s1))

c. 集合无序

print({1, 2, 3} == {3, 1, 2})      # True

d. 元素是不可变类型的数据

s2 = {10, 'abc', (1, 2)}
print(s2)
# s3 = {10, 'abc', [1, 2]}          # 报错!

e. 元素是唯一的 - 去重

s3 = {10, 20, 10, 10, 30, 20}
print(s3)       # {10, 20, 30}

f. 数学集合运算：&(交集)、|(并集)、-(差集)、^(对称差集)、>、<、>=、<=

s1 = {1, 2, 3, 4, 5, 6, 7}
s2 = {5, 6, 7, 8, 9, 10}

# &(交集)  - 集合1 & 集合2   - 获取两个集合的公共部分
print(s1 & s2)    # {5, 6, 7}

# 集合1 | 集合2   -  合并两个集合
print(s1 | s2)      # {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

# 集合1 - 集合2
print(s1 - s2)      # {1, 2, 3, 4}
print(s2 - s1)      # {8, 9, 10}

# 集合1 ^ 集合2
print(s1 ^ s2)     # {1, 2, 3, 4, 8, 9, 10}

g. >、<、>=、<= 判段是否是子集和真子集

"""
{1, 2, 3}
子集：{}、{1}, {2}, {3}、{1, 2}、{1, 3}、{2, 3}、{1, 2, 3}
真子集：{}、{1}, {2}, {3}、{1, 2}、{1, 3}、{2, 3}
"""
# >、<  - 判断是否是真子集
# 集合1 > 集合2   -  集合2是否是集合1的真子集

# >=、<=  - 判断是否是子集

2. 认识字符串

什么是字符串

"""
字符串是容器型数据类型；将''、""、''''''、""""""作为容器的标志，引号中的每个符号就是字符串的元素
字符串是不可变的；字符串有序(支持下标操作)
元素：引号中的每个符号就是字符串的元素，字符串的元素又叫字符。字符分为普通字符和转义字符两种
"""

a. 引号中的每个符号都是字符串的元素，对于符号本身没有限制

str1 = 'shushso982982090-=[';/']'

b. 引号问题

str2 = 'abc'
str3 = "abc"
str4 = '''abc'''
print(type(str2), type(str3), type(str4), type(str5))       # <class 'str'> <class 'str'> <class 'str'>

c. 多行字符串 - 三个引号开头的字符串，字符串内容可以直接按回车换行

str1 = '''abc
123
MN'''
print(str1)

d. 空串

str1 = ''

3. 字符串和转义字符

1. 字符 - 字符串的元素

"""
1）普通字符  -   在字符串中表示符号本身的字符就是普通字符，例如：中文、字母、数字等

2）转义字符 - 在特定的符号前加\来表示特殊功能或者特殊意义的符号就是转义字符
\t  -   水平制表符(相当于按一个tab键)
\n  -   换行
\'  -   表示一个普通的单引号
\"  -   表示一个普通的双引号
\\  -   表示一个普通的反斜杠
"""

print('\tabc\n123')       

print('it\'s me')       # it's me
print("it's me")        # it's me

print("I say:\"you see see, one day day\"")     # I say:"you see see, one day day"

2. R语法

"""
字符串的最前面可以加r或者R，让字符串中所有的转义字符功能消失，所有的符号都变成普通字符: r''、R''
"""
str1 = R'\tabc\n123\u4e00'
print(str1)

path = r'C:\users\xiaotao\name\test\demo\a.txt'
print(path)

4. 字符编码

1. 字符编码

"""
计算机存储原理：计算机保存数据的时候只能存数字，而且存的是数字的补码

字符编码：为了能够让计算机保存文字符号，我们给每一个符号对应了一个固定数字，在存储符号的时候就保存这个符号对应的数字，
        那么这个数字就是这个符号的编码值
"""

2. 编码值 - 保存符号和编码值对应关系的表

"""
1) ASCII码表: 通过一个字节来对128个字符进行编码，里面的字符是美国通用的符号。
          数字在大写字母的前面、大写字母在小写字母前面、大写字母和小写字母之间有间隙(A - 65; a - 97)

2) Unicode编码表(python):  包含了世界上所有的国家所有民族的所有的语言的符号（万国码）
        a. Unicode编码表是ASCII码表的扩展，它包含ASCII码表
        b. 中文编码值范围(16进制)：4e00 ~ 9fa5
"""

3. python使用编码值

chr 函数： chr(编码值) - 获取编码值对应的字符

print(chr(97))      # a
print(chr(65))      # A

# 注意：如果想要在程序中直接使用16进制数，数字前必须加前缀'0x'、'0X'
print(chr(0x4e00))      # 一

打印所有中文

count = 0
for x in range(0x4e00, 0x9fa5+1):
    count += 1
    print(chr(x), end=' ')
    if count % 40 == 0:
        print()

ord函数：ord（字符） - 获取指定字符对应的编码值

print(ord('余'), ord('婷'))       # 20313 23159
print(ord('钱'))     # 38065

# hex(十进制数)  -  获取指定十进制对应的16进制
print(hex(20313), hex(23159))       # 0x4f59 0x5a77

编码字符：在字符串中用’\u4位的16进制编码值’来表示一个字符

str1 = 'a\u0061一\u4e00'
print(str1)

# 判断x是否是中文
x = '9'
# print('一' <= x <= '龥')
print('\u4e00' <= x <= '\u9fa5')

5. 获取字符

1. 查 - 获取元素（字符）

str1 = '\thello world!'

注意：一个转义字符长度是1，一个空格的长度也是1
print(str1[2])      # 'e'
print(str1[-1])     # '!'

print(str1[1:4])        # 'hel'

str2 = 'hajsks'
print(str2[1:-1])       # 'ajsk'
print(str2[1:])         # 'ajsks'

str3 = 'abc123'
for x in str3:
    print(x)

2. 相关操作

a. 字符串1 + 字符串2 - 将两个字符串合并成一个字符串

str1 = 'hello'
str2 = 'python'
str3 = str1 + str2
print(str3)     # 'hellopython'

b. 字符串 * N 、 N * 字符串 - 将N个字符串合并成一个字符

print(str1 * 3)     # 'hellohellohello'

c. 比较大小: >、>=、<=、<

两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
两个字符比较大小就是比较两个字符的编码值的大小

"""
x是否是数字：'0' <= x <= '9'
x是否是小写字母：'a' <= x <= 'z'
x是否是字母：'a' <= x <= 'z' or 'A' <= x <= 'Z'
x是否是中文：'\u4e00' <= x <= '\u9fa5'
"""

练习1：已知一个字符串，统计字符串中数字字符的个数

str1 = 'abc1123你好110'     # 7
count = 0
for x in str1:
    if '0' <= x <= '9':
        count += 1
print(count)

练习2：已知一个字符串，提取字符串中所有的中文字符

str1 = 'ab啊c1123你好110是-2=2'    # '啊你好是'
new_str = ''
for x in str1:
    if '\u4e00' <= x <= '\u9fa5':
        new_str += x
print(new_str)      # '啊你好是'

3. in 和 not in

a. 字符串1 in 字符串2 - 判断字符串2中是否包含字符串1（判断字符串1是否是字符串2的子串）

b. 'abc’的字串： ‘’、‘a’、‘b’、‘c’、‘ab’、‘bc’、‘abc’

print('a' in 'abc')     # True
print('ab' in 'abc')    # True
print('ac' in 'abc')    # False

tyd1320836926

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
day 8 - 元组、集合和字符串

day 8 - 元组、集合和字符串1. 元组和集合1. 元组a. 什么是元组（tuple）"""容器; 将()作为容器的标志，里面多个元素用逗号隔开：(元素1, 元素2, 元素3, ...)不可变的(不支持增删改); 有序的(支持下标操作)元素：任何数据"""b. 空元组t1 = ()c . 只有一个元素的元组(重点!) - 唯一的这个元素后面必须加逗号t2 = (100,)print(t2, type(t2), len(t2))d. 在没有歧义的情况下，元组的()可以
复制链接

扫一扫