DAY08 元组集合和字符串

本文详细介绍了Python中的元组和集合,包括它们的定义、特性以及操作。元组是不可变的有序容器,集合是可变的无序容器。接着,文章讲解了字符串的基础知识,如字符串的不可变性、字符与转义字符,以及字符编码。最后,讨论了如何在字符串中获取字符、进行相关操作,并提供了两个实际的编程练习。
摘要由CSDN通过智能技术生成

DAY08 元组集合和字符串

一. 元组和集合

1.1 元组
  1. 什么是元组(tuple)
  • 容器:将()作为容器的标志,里面多个元素用逗号隔开:(元素1, 元素2, 元素3,…)
  • 不可变的(不支持增删改);有序的(直接下标操作)
  • 元素:任何数据
# 空元组
t1 = ()

# 只有一个元素的元组 - 唯一的这个元素后面必须加逗号
print([10])    # [10]

t2 = (100)
print(t2, type(t2))   # 100 <class 'int'>
t2 = (100, )
print(t2, type(t2))   # (100,) <class 'tuple'>

# 在没有歧义的情况下,元组的小括号可以省略 - 直接将多个数据用逗号隔开,表示的也是一个元组
t3 = 10, 20, 30
print(t3)     # (10, 20, 30)
t4 = 10,
print(t4, type(t4))   # print(t4, type(t4))   有括号必须有逗号,有逗号可以没括号

  1. 元组就是不可变的列表
1.2 集合
  1. 什么是集合(set)
    • 容器:将{}作为容器的标志,里面多个元素用逗号隔开:{元素1, 元素2, 元素3,…}
    • 可变的;无序的
    • 元素要求:和字典对键的要求一样(不可变的数据;唯一的)
# 空集合
s1 = {}  # 空字典
s2 = set()  # 空集合
print(type(s2), len(s2))   # <class 'set'> 0

# 集合无序
print({1, 2, 3} == {3, 2, 1})   # True

# 元素是不可变类型的数据
s3 = {10, 'abc', (1, 2)}
print(s3)    # {'abc', 10, (1, 2)}
# s4 = {10, 'abc', [1,2]}  [1, 2]列表为可变数据类型,报错

# 元素是唯一的 - 去重
s4 = {10, 20, 10, 10, 30, 20}
print(s4)     # {10, 20, 30}
  1. 数学集合运算: &(交集)、|(并集)、-(差集)、^(对称差集)、>、<
s1 = {1, 2, 3, 4, 5, 6, 7}
s2 = {5, 6, 7, 8, 9, 10}

# &(交集) - 集合1 & 集合2 - 获取两个集合的公共部分
print(s1 & s2)   # {5, 6, 7}
# | - 集合1 | 集合2 - 合并两个集合
print(s1 | s2)  # {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
# -  -   集合1 - 集合2
print(s1 - s2)
print(s2 - s1)

# 集合1 ^ 集合2
print(s1 ^ s2)

# >. <   -    判断是否是真子集
# 集合1 > 集合2  -  集合2是否是集合1的真子集

# >=. <=   -    判断是否是子集

二. 认识字符串

Q:什么是字符串

A:

  • 字符串是容器型数据类型;将’‘,“”,’‘’‘’',“”“”""作为容器的标志,引号中的每个符号就是字符串的元素
  • 字符串是不可变的;字符串有序(支持下标操作)
  • 元素:引号中的每个符号就是字符串的元素,字符串的元素又叫字符。字符分为普通字符和转移字符两种
  1. 引号中的每个符号就是字符串的元素,对于符号没有限制
str1 = 'abc23红色经典mn'
new_str1 = str1.upper() # 产生新的字符串,原字符串不可修改
print(new_str1)   # ABC23红色经典MN
  1. 引号问题
str2 = 'abc'
str3 = "abc"
str4 = '''abc'''
str5 = """abc"""
print(type(str2), type(str3), type(str4), type(str5))
# <class 'str'> <class 'str'> <class 'str'> <class 'str'>
  1. 多行字符串 - 三个引号开头的字符串,字符串内容可以直接回车换行
str1 ='''abc
123
'''
print(str1)

'''
abc
123
'''

# str1 = 'abc
# 123'   报错
  1. 空串
str = ''  # ''中什么都不写,也不可以有空格

三. 字符和转义字符

3.1 字符

字符串的元素

  1. 普通字符 - 在字符串中表示符号本身的字符就是普通字符,例如:中文、字母、数字等
  2. 转义字符 - 在特定的符号前加反斜杠\来表示特殊功能或者特殊意义的符号就是转移字符
    \t - 水平制表符(相当于按一个tab键)
    \n - 换行
    \’ - 表示一个普通的单引号
    \" - 表示一个普通的双引号
    \ - 表示一个普通的反斜杠
print('\tabc\n123')
print('it\'s me')   # it's me
print("it's me")    # it's me

print('\\tabc\\n123')   # \tabc\n123
3.2 R语言

字符串的最前面可以加r或者R,让字符串中所有的转移字符功能消失,所有的符号都是变成普通字符:r’‘、R’’

print('\tabc\n123')
str1 = r'\tabc\n123'
print(str1)   # \tabc\n123

四. 字符编码

4. 1 字符编码
  • 计算机存储原理:计算机保存数据的时候只能存数字,而且存的是数字的补码
  • 字符编码:为了能够让计算机保存文字符号,我们给每一个符号对应了一个固定数字,在存储符号的时候就保存这个符号对应的数字,那么这个数字就是这个符号的编码值
4.2 编码表

保存符号和编码值对应关系的表

  • ASCII码表:通过一个字节来对128个字符进行编码,里面的字符是美国通用的符号
    数字在大写字母前面,大写字母在小写字母前面,大写字母和小写字母之间有间隙(A - 65, a - 97)

  • unicode编码表(python):包含了世界上所有的国家所有的名族的所有的语言的符号(万国码)
    a.Unicode编码表是ASCII码表的扩展,它包含ASCII码表
    b.中文编码值范围:4e00~9fa5

4.3 python使用编码值
  1. chr函数:chr(编码值) - 获取编码值对应的字符
print(chr(65))    # A
# 注意:如果想要在程序中直接使用16进制,数字前必须加前缀'0x','0X'
print(chr(0x4e00))   # 一

for x in range(0x4e00, 0x9fa5 + 1):
    print(chr(x), end='')
  1. ord函数:ord(字符) - 获取指定字符对应的编码值
print(ord('一'), ord('二'), ord('三'))   

# hex(十进制数) - 获取指定十进制对应的16进制
print(hex(26446), hex(20255), hex(40511))  # 0x674e 0x4f1f 0x9e3f
  1. 编码字符 - 在字符串中用’\u4位的16进制数’来表示一个字符
str1 = 'a\u0061'
print(str1)   # aa
# 判断x是否是中文
x = '二'
print('一' <= x <= '龥')
print('\u4e00' <= x <= '\u9fa5')

五. 获取字符

5.1 查 - 获取元素(字符)
# 列表获取元素的方法字符串都支持
str1 = '\thello world!'

# 注意:一个转移字符长度是1,一个空格的长度也是1
print(str1[2])   # 'e'
print(str1[-1])   # '!'

print(str1[1:4])   # 'hel'

str2 = 'hajsks'
print(str2[1:-1])

print('--------------------优雅转场,华丽分割-------------------')
str3 = 'abc123'
for x in str3:
    print(x)

for index in range(len(str3)):
    print(index, str3[index])

for index, item in enumerate(str3):
    print(index, item)
5.2 相关操作
  1. +、*

    字符串1 + 字符串2 - 将两个字符串合并成一个字符串

str1 = 'hello'
str2 = 'python'
str3 = str1 + str2
print(str3)      # hellopython

​ 字符串 * N 、N * 字符串 - 将N个字符串合并成一个字符

print(str1 * 3) # hellohellohello
  1. 比较大小: >、>=、<=、<
  • 两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
  • 两个字符比较大小就是比较两个字符的编码值的大小
    • 是否是数字:‘0’ <= x <= ‘9’
    • 是否是小写字母:‘a’ <= x <= ‘z’
    • 是否是字母:‘a’ <= x <= ‘z’ or ‘A’ <= x <= ‘Z’
    • 是否是中文: ‘\u4e00’ <= x <= ‘\u9fa5’
print('abc' < '1234567890')   # False
# 练习1:已知一个字符串,统计字符串中数字字符的个数
str1 = 'abc1123你好110'
count = 0
for x in str1:
    if '0' <= x <= '9':
        count += 1
print(count)

# 练习2:已知一个字符串,提取字符串中所有的中文字符
str1 = 'ab啊c1123你好110是-2=2'    # '啊你好是'
new_str = ''
for x in str1:
    if '\u4e00' <= x <= '\u9fa5':
        new_str += x
print(new_str)
  1. in 和 not in

字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)

print('a' in 'abc') # True
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值