Day8 元组和字符串
文章目录
1. 元组
1.1 什么是元组(tuple)
1)元组是容器型数据类型:将()作为容器的标志,里面多个元素用逗号隔开:(数据1, 数据2, 数据3, …)
2)元组是不可变的(不支持增删改);有序的(支持下标操作)
3)元素:没有要求
- 空元组(无意义)
t1 = ()
print(len(t1))
0
1.2 特点1
有一个元素的元组在表示的时候唯一的一个元素后面必须加逗号
区分:
t2 = (10)
print(t2, type(t2))
10 <class ‘int’>
t2 = (10,)
print(t2, type(t2), len(t2))
(10,) <class ‘tuple’> 1
1.3 特点2
在没有歧义的情况下,元组的()可以省略(直接将多个数据有逗号隔开表示的也是一个元组)
t3 = (10, 20, 30)
print(t3, len(t3))
(10, 20, 30) 3
或
t3 = 10, 20, 30
print(t3, len(t3))
(10, 20, 30) 3
1.4 解包
使用多个变量直接获取元组、列表中的多个元素
t4 = (10, 20, 30)
print(t4[0], t4[1], t4[2])
x, y, z = t4
print(x, y, z)
10 20 30
10 20 30
a, b, c = (11, 22, 33)
print(a, b, c)
11 22 33
list1 = [100, 200, 300]
for index, item in enumerate(list1):
print(index, item)
0 100
1 200
2 300
1.5 元组就是不可变的列表
t4 = (10, 20, 30)
print(t4[-1])
print(t4[1:])
print(t4 * 2, t4 + (1, 100))
print(10 in t4)
print((10, 20, 30) > (1, 100, 200, 39993))
30
(20, 30)
(10, 20, 30, 10, 20, 30) (10, 20, 30, 1, 100)
True
True
2.认识字符串
2.1 什么是字符串(str)
1)字符串是容器型数据类型(字符串对应的容器只能保存多个文字符号-字符)。将’'或者""作为容器的标志,里面的每个符号包括的就是字符串中的各个元素
2)不可变的(不支持增删改);字符串有序(支持下标操作)
3)元素:引号中的每个符号都是字符串的元素(任何文字符号都可以是字符串的元素,
注意:字符串的元素(字符)分为两种:普通字符(符号在字符中表示它本身)、转义字符(
str1 = 'abc'
str2 = "abc"
# 多行字符串
str3 = '''abc''' # 代码样式所见即所得,一般不使用
str4 = """abc""" # 代码样式所见即所得,一般不使用
print(str1, str2, str3, str4)
abc abc abc abc
str1 = 'abc'
new_str1 = str1.upper() # 注意不是修改字符串,而是创建了一个新的字符串
print(new_str1)
ABC
字符串有序
print('abc' == 'bca')
False
任何文字符号都可以是字符串的元素
str2 = 'amKN12,.。;=-+&^%函数😁♠♣'
print(str2)
amKN12,.。;=-+&^%函数😁♠♣
普通字符
str3 = 'ak2你'
print(str3)
ak2你
\t是转义字符
str4 = 'a\tb123'
print(str4)
a b123
3. 字符
3.1 转义字符
转义字符是由\和另外一个或多个符号一起组合而成的(转义字符一定是由\开头)
在特定的符号前加上\,让这个符号在字符串中具有特殊功能或特殊意义的字符。
转移字符一般是固定(并不是随便一个字符就可以是转义字符)
常见的转义字符:
\n - 换行
\t - 水平制表符(相当于按tab键)
\ ’ - 表示一个普通的单引号
\ " - 表示一个普通的双引号
\ \ - 表示一个普通的反斜杠
- 不是任何字符加\都可以成为转义字符
str1 = '\m'
print(str1)
\m
- \n - 换行
\t - 水平制表符(相当于按tab键)
str1 = '\t床上明月光,\n\t疑是地上霜,\n\t举头望明月,\n\t低头思故乡。'
print(str1)
- \ ’ - 表示一个普通的单引号
# It's me!
str1 = 'It\'s me'
print(str1)
# 或
str1 = "It's me"
print(str1)
It’s me
It’s me
- \ " - 表示一个普通的双引号
# I say:"good good study! day day up!"
str1 = 'I say:"good good study! day day up!"'
print(str1)
# 或
str1 = "I say:\"good good study! day day up!\""
print(str1)
I say:“good good study! day day up!”
I say:“good good study! day day up!”
- \ \ - 表示一个普通的反斜杠
# C:\Python310\tools\scripts
path = 'C:\Python310\tools\scripts'
print(path) # 路径可能会被受影响
# 修改后
path = 'C:\\Python310\\tools\\scripts'
print(path)
3.2 r字符串
在字符串引号前加 r 或 R
目的:在字符串前加 r/R ,会使字符串中所有的转义字符功能都消失(r字符串中所有的字符都是普通字符)
str3 = r'\tabc\n'
print(str3)
\tabc\n
path = r'C:\Python310\tools\scripts'
print(path)
C:\Python310\tools\scripts
3.3 编码字符
所有的字符都可以表示成编码字符
\u四位的十六进制数
str1 = '\u4e00' # 汉文数字一
print(str1)
str1 = '\u9fa5'
print(str1)
一
龥
3.4 补充
1)10进制数(生活): 由0~9组成的数字; 18, 16500, 22
100, 25
2)2进制数:由0和1组成的数字:10000, 1100,1011 ,101
0b1001
3)8进制数:由0~7组成的数字:245, 002, 777, 771, 071
0o77
4)16进制数:由09和af(A~F)组成的数字:1f、abc、4e00、0ff
0x89
4.字符编码
4.1 字符编码
是计算机存储数据的原理,计算机只具备存储数字的能力
文字:为了能够让计算机保存文字信息,就给每一个文本符号对应一个固定的数字,每次在需要存储这个文本符号的,就存储这个符号对应的数字。
这个数字就叫这个符号的编码值。
4.2 编码表
是保存每个符号对应的编码值的表
1)ASCII码表
总共有128个字符对应的编码值,主要包含:常用的英文符号、数字字符、和字母
A - 65
a - 97
2)Unicode编码表(Python)
Unicode编码表中包含ASCII表
Unicode又叫统一码、万国码,它包含了世界上所有国家所有民族的所有语言的符号。
中文编码:4e00 ~ 9fa5
print(0x9fa5 - 0x4e00)
20901
4.3 编码值的应用
1)chr(编码值) - 获取指定编码值对应的字符
print(chr(97))
print(chr(0x4e00)) # 一
print(chr(0x9fa5)) # 龥(yù)
a
一
龥
2)ord(字符) - 获取指定字符对应的编码值(编码值以十进制的方式返回)
注意:字符 - 长度为1的字符串
print(ord('a'))
print(hex(20313), hex(23159)) # hex(数字) - 将数字表示成16进制数
97
0x4f59 0x5a77
练习:将小写字母转换成大写字母
# A - 65 a - 97 差值:32
# B - 66 b - 98 差值:32
c1 = 'm'
print(chr(ord(c1)-32))
M
4.4 编码字符
在字符串中表示字符的方式有两种:直接提供字符,也可以提供编码字符
# \u4位的16进制编码值
str1 = 'a一龥'
str2 = '\u0061\u4e00\u9fa5'
print(str1, str2)
a一龥 a一龥
练习:判断c2保存的字符是否是中文
c2 = '看'
if '\u4e00' <= c2 <= '\u9fa5':
print(c2, '是中文')
else:
print(c2, '不是中文')
看 是中文
练习:判断c2保存的字符是否是大写字母
c2 = 'a'
if 'A' <= c2 <= 'Z':
print('是大写字母')
else:
print('不是大写字母')
不是大写字母
两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
print('abc' > '一zzzzashf')
False
5. 字符串基本操作
5.1 查
字符串查也有下标,和列表的方法一样,列表查出来是列表,字符串查出来也是字符串
message = 'hello python!'
print(message[0], message[-1], message[4])
print(message[1:-1:2]) # 'el yhn'
print(message[1:4:-1]) # ''
print(message[2:])
message = 'hello python!'
for x in message:
print(x)
message = 'hello python!'
for index, item in enumerate(message):
print(index, item)
5.2 +、* 的运用
- 字符串1 + 字符串2 - 将两个字符串合并,产生一个新的字符串
- 字符串 * N - 字符串重复N次产生一个新的字符串
str1 = 'abc'
str2 = 'hello'
result = str1 + str2
print(result)
abchello
result = str1 * 3
print(result)
abcabcabc
5.3 in 和 not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1
str2 = 'hello'
print('a' in str2) # False
print('h' in str2) # True
print('he' in str2) # True
print('hl' in str2) # False
练习:统计str1中中文的个数
str1 = '换手机hss8223Kks是sjd==222'
count = 0
for i in str1:
if '一' <= i <= '\u9fa5':
count += 1
print(count)
4
练习:提取字符串中所有的大写字母
str2 = '涉及到MJk230023sjkU293shT=='
# 'MJUT'
new_str2 = ''
for i in str2:
if 65 <= ord(i) <= 90:
new_str2 += i
print(new_str2)
MJUT