Day 09
一、元组
# 1. 什么是元组(tuple)
- 元组是容器型数据类型;将()作为容器的标志,里面多个元素用逗号隔开:(数据1, 数据2, 数据3, …)
- 元组是不可变的(不支持增删改); 有序的(支持下标操作)
- 元素:没有要求
2. 只有一个元素的元组在表示的时候唯一的元素后面必须加逗号
t2 = (10,)
print(t2, type(t2), len(t2))
# (10,) <class 'tuple'> 1
3. 在没有歧义的情况下,元组的()可以省略 (直接将多个数据用逗号隔开表示的也是一个元组)
t3 = 10, 20, 30
print(t3, len(t3))
# (10, 20, 30) 3
4. 解包 - 使用多个变量直接获取元组、列表中的多个元素
t4 = (10, 20, 30)
print(t4[0], t4[1], t4[2])
# 10 20 30
x, y, z = t4
print(x, y, z)
# 10 20 30
list1 = [100, 200, 300]
for index, item in enumerate(list1):
print(index, item)
'''
0 100
1 200
2 300
'''
for x, y in enumerate(list1):
print(x, y)
'''
0 100
1 200
2 300
'''
5.元组就是不可变的列表
- 列表的大部分操作对元组一样有效
t4 = (10, 20, 30)
print(t4[-1])
print(t4[1:])
print(t4 * 2, t4 + (1, 100))
print(10 in t4)
print((10, 20, 30) > (1, 100, 200, 39993))
'''
30
(20, 30)
(10, 20, 30, 10, 20, 30) (10, 20, 30, 1, 100)
True
True
Process finished with exit code 0
'''
二、字符串
1. 什么是字符串(str)
- 字符串是容器型数据类型(字符串对应的容器只能保存多个文字符号-字符)。将’'或者""作为容器的标志,里面的每个符号就是字符串中每个元素
- 不可变的(不支持增删改);字符串有序(支持下标)
- 元素:引号中每个符号都是字符串的元素(任何文字符号都可以是字符串的元素),字符串的元素又叫字符
- 注意:字符串的元素(字符)分为两种:普通字符(符号在字符串中表示它本身)、转义字符(符号在字符串中有特殊功能或者特殊意义,没有表示这个符号本身)
str1 = 'abc,123'
str2 = "abc"
# 多行字符串
str3 = '''abc'''
str4 = """abc"""
# 多行注释只有在特定的位置上才是注释
def func1():
"""多行注释"""
"""abc"""
class A:
"""多行注释"""
"""abc"""
- 字符串不可变,所有可变操作都是在创建对应的新的字符串
str1 = 'mna'
new_str1 = str1.upper()
print(str1, new_str1)
# mna MNA
- 字符串有序
print('abc' == 'bca') # False
- 任何文字符号都可以是字符串的元素
str2 = 'amKN12,.。;=-+&^%函数😁♠♣'
print(str2)
# amKN12,.。;=-+&^%函数😁♠♣
# 普通字符
str3 = 'ak2你'
print(str3) # ak2你
# ak2你
# \t是转义字符
str4 = 'a\tb123'
print(str4)
# a b123
三、字符
1. 转义字符
-
转义字符是由\和另外一个或者多个符号一起组合而成(转义符一定是\开头)。
-
在特定的符号前加上\,让这个符号在字符串中具有特殊的功能或者特殊意义的字符就是转义字符。
-
转义字符有哪些是固定(并不是随便一个字符前加\都可以变成转义字符)。
-
常见的转义字符:
\n - 换行
\t - 水平制表符(相当于按tab键)
str1 = '\tabc\n123'
print(str1)
str1 = '\t床前明月光,\n\t疑是地上霜。\n\t举头望明月,\n\t低头思故乡。'
print(str1)
'''
abc
123
床前明月光,
疑是地上霜。
举头望明月,
低头思故乡。
'''
’ - 表示一个普通的单引号
" - 表示一个普通的双引号
# It's me!
str1 = 'It\'s me!'
print(str1)
str1 = "It's me!"
print(str1)
# I say:"good good study,day day up"
str1 = 'I say:"good good study,day day up"'
print(str1)
str1 = "I say:\"good good study,day day up\""
print(str1)
# 1'30"
str1 = '1\'30"'
print(str1)
'''
It's me!
It's me!
I say:"good good study,day day up"
I say:"good good study,day day up"
1'30"
'''
\ - 表示一个普通的反斜杠
# c:\study\abc\bin\text.txt
path = 'c:\study\\abc\\bin\\text.txt'
print(path) # c:\study\abc\bin\text.txt
2. r字符串 - 在字符串引号前加r或者R
- 如果表示字符串的时候在字符串最前面加r/R,可以让字符串中所有的转义字符功能消失。(r字符串中所有的字符都是普通字符)
path = r'c:\study\abc\bin\text.txt'
print(path)
# c:\study\abc\bin\text.txt
3.编码字符(所有的字符都可以表示成编码字符)
- \u四位的十六进制数
str1 = '\u4e00abc一\u0023'
print(str1)
# 一abc一#
补1:16进制数
-
10进制数(生活): 由0~9组成的数字; 18, 16500, 22
100, 25 -
2进制数:由0和1组成的数字:10000, 1100,1011 ,101
0b1001 -
8进制数:由0~7组成的数字:245, 002, 777, 771, 071
0o77 -
16进制数:由09和af(A~F)组成的数字:1f、abc、4e00、0ff
0x89
四、字符编码
1. 字符编码
-
计算机存储数据只能存数字(计算机只具备存储数字的能力)。
-
为了能够让计算机保存文字信息,就给每一个文本符号对应一个固定的数字,每次在需要存储这个文本符号的,就存储这个符号对应的数字。
-
这个数字就叫这个符号的编码值。
2.编码表 - 保存每个符号对应的编码值的表
- ASCII码表:
- 总共有128个字符对应的编码值,主要包含:常用的英文符号、数字字符、和字母
- A - 65
- a - 97
- Unicode编码表(Python):
- Unicode编码表中包含ASCII表
- Unicode又叫统一码、万国码,它包含了世界上所有国家所有民族的所有语言的符号。
- 中文编码:4e00 ~ 9fa5
3. 编码值的应用
- chr(编码值) - 获取指定编码值对应的字符
print(chr(97)) # a
print(chr(0x4e00)) # 一
print(chr(0x9fa5)) # 龥(yù)
- ord(字符) - 获取指定字符对应的编码值(编码值以10进制的方式返回值)
- 注意:字符 - 长度为1的字符串
print(ord('a'), ord('A'))
# 97 65
print(hex(20313), hex(23159)) # hex(数字) - 将数字表示成16进制数
# 0x4f59 0x5a77
- 案例:将小写字母转换成大写字母
- A - 65 a - 97 32
- B - 66 b - 98 32
c1 = 'b'
result = chr(ord(c1) - 32)
print(result) # B
- 编码字符
- 在字符串中表示字符的方式有两种:直接提供字符,也可以提供一个编码字符。
- \u4位的16进制编码值
str1 = 'a一龥'
str2 = '\u0061\u4e00\u9fa5'
print(str1, str2)
# a一龥 a一龥
- 案例:判断c2保存的字符是否是中文
c2 = '看'
if '\u4e00' <= c2 <= '\u9fa5':
print(c2, '是中文')
else:
print(c2, '不是中文')
# 看 是中文
- 案例:判断c2保存的字符是否是大写字母
c2 = 'a'
if 'A' <= c2 <= 'Z':
print('是大写字母')
else:
print('不是大写字母')
# 不是大写字母
- 两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
print('abc' > '一zzzzashf')
#False
五、字符串的基本操作
1. 查
- 字符串获取元素和列表获取元素的语法一模一样
message = 'hello python!'
print(message[0], message[-1], message[4]) # h ! o
print(message[1:-1:2]) # 'el yhn'
print(message[1:4:-1]) # ''
print(message[2:]) # 'llo python!'
for x in message:
print(x)
'''
0 h
1 e
2 l
3 l
4 o
5
6 p
7 y
8 t
9 h
10 o
11 n
12 !
'''
for index, item in enumerate(message):
print(index, item)
'''
0 h
1 e
2 l
3 l
4 o
5
6 p
7 y
8 t
9 h
10 o
11 n
12 !
'''
2.字符串的运算
- 字符串1 + 字符串2 - 将两个字符串合并,产生一个新的字符串
str1 = 'abc'
str2 = 'hello'
result = str1 + str2
print(result) # 'abchello'
- 字符串 * N - 字符串重复N次产生一个新的字符串
str1 = 'abc'
result = str1 * 3
print(result) # 'abcabcabc'
3. in 和 not in
- 字符串1 in 字符串2 - 判断字符串2中是否包含字符串1
str2 = 'hello'
print('a' in str2) # False
print('h' in str2) # True
print('he' in str2) # True
print('hl' in str2) # False
- 案例:统计str1中中文的个数
str1 = '换手机hss8223Kks是sjd==222'
count = 0
for x in str1:
if '一' <= x <= '\u9fa5':
count += 1
print(count)
- 案例:提取字符串中所有的大写字母
str2 = '涉及到MJk230023sjkU293shT=='
# 'MJUT'
# ''+'M' -> 'M' + 'J' -> 'MJ' + 'U' -> 'MJU' + 'T' -> 'MJUT'
new_str2 = ''
for x in str2:
if 'A' <= x <= 'Z':
new_str2 += x
print(new_str2) # 'MJUT'
练习题
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入’abcd1234 ’ 输出’bd24’
str1 = 'abcd1234'
for i in str1[1::2]:
print(i)
- 输入用户名,判断用户名是否合法(用户名长度6~10位)
username = input('请输入用户名:')
if 6 <= len(username) <= 10:
print('用户名合法')
else:
print('用户名不合法')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
for i in username:
if not ('a' <= i <= 'z' or '1' <= i <= '9' or 'A' <= i <= 'Z'):
print('用户名不合法')
break
else:
print('用户名合法')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:‘123992’
str2 = 'abc1shj23kls99+2kkk'
str3 = ''
for i in str2:
if '1' <= i <= '9':
str3 += i
print(str3)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 ‘A2H2KLM12+’
str4 = 'a2h2klm12+'
str5 = ''
for i in str4:
if 'a' <= i <= 'z':
i = chr(ord(i) - 32)
str5 += i
else:
str5 += i
print(str5)
# 方法二
print(str4.upper())
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
num = int(input('输入一个小于1000的数字:'))
print('py' + str(1901000 + num))
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**‘===’** 输出:3
str_1 = str(input('请输入一个字符串:'))
count = 0
for i in str_1:
if not ('a' <= i <= 'z' or '1' <= i <= '9' or 'A' <= i <= 'Z'):
count += 1
print(count)
-
输入字符串,将字符串的开头和结尾变成’+',产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+'**
str_2 = 'abc123'
print('+' + str_2[1:-1] + '+')
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str_3 = 'abc123'
len1 = len(str_3) // 2
if len(str_3) % 2:
print(str_3[len1])
else:
print(str_3[len1 - 1], str_3[len1])
-
写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str_4 = 'how are you? Im fine, Thank you!'
str_5 = 'you'
for i in range(len(str_4)):
if str_4[i] == str_5[0]:
print(i)
break
-
获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = 'abc123'
str2 = 'huak3'
str3 = ''
for i in str1:
if i in str2:
str3 += i
print(str3)
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
if 'A' <= name[0] <= 'Z' and len(name) > 1:
for i in name[1:]:
if '0' <= i <= '9':
pass
elif 'A' <= i <= 'Z' or 'a' <= i <= 'z':
continue
else:
print('用户名不合法')
break
else:
print('用户名合法')
else:
print('用户名不合法3')