元组和字符串
元组
-
什么是元组(tuple)
a. 元组是容器型数据类型;将()作为容器的标志,里面多个元素用逗号隔开:(数据1, 数据2, 数据3, …)
b. 元组是不可变的(不支持增删改); 有序的(支持下标操作)
c. 元素:没有要求
d. 空元组
t1 = ()
-
只有一个元素的元组在表示的时候唯一的元素后面必须加逗号
t2 = (10,) print(t2, type(t2), len(t2)) # (10,) <class 'tuple'> 1
-
在没有歧义的情况下,元组的()可以省略 (直接将多个数据用逗号隔开表示的也是一个元组)
t3 = 10, 20, 30 print(t3, len(t3)) # (10, 20, 30) 3
-
解包 - 使用多个变量直接获取元组、列表中的多个元素
t4 = (10, 20, 30) print(t4[0], t4[1], t4[2]) # 10 20 30 x, y, z = t4 print(x, y, z) # 10 20 30 list1 = [100, 200, 300] for index, item in enumerate(list1): print(index, item) # 0 100 # 1 200 # 2 300 for x, y in enumerate(list1): print(x, y) # 0 100 # 1 200 # 2 300 d1 = {'a': 10, 'b': 20, 'c': 30} for key, item in d1.items(): print(key, item) # a 10 # b 20 # c 30 print(d1.items()) # dict_items([('a', 10), ('b', 20), ('c', 30)])
-
元组就是不可变的列表
t4 = (10, 20, 30) print(t4[-1]) # 30 print(t4[1:]) # (20, 30) print(t4 * 2, t4 + (1, 100)) # (10, 20, 30, 10, 20, 30) (10, 20, 30, 1, 100) print(10 in t4) # True print((10, 20, 30) > (1, 100, 200, 39993)) # True
认识字符串
-
字符串是容器型数据类型(字符串对应的容器只能保存多个文字符号-字符)。将’'或者""作为容器的标志,里面的每个符号就是字符串中每个元素
a. ''和""
str1 = 'abc,123' str2 = "abc"
b. 多行字符串
str3 = '''abc''' str4 = """abc"""
多行注释只有在特定的位置上才是注释
def func1(): """多行注释""" """abc""" class A: """多行注释""" """abc"""
-
不可变的(不支持增删改);字符串有序(支持下标)
a. 字符串不可变,所有可变操作都是在创建对应的新的字符串
str1 = 'mna'
new_str1 = str1.upper()
print(str1, new_str1) # mna MNA
b. 字符串有序
print('abc' == 'bca') # False
-
元素:引号中每个符号都是字符串的元素(任何文字符号都可以是字符串的元素),字符串的元素又叫字符
注意:字符串的元素(字符)分为两种:普通字符(符号在字符串中表示它本身)、转义字符(符号在字符 串中有特殊功能或者特殊意义,没有表示这个符号本身)a. 任何文字符号都可以是字符串的元素
str2 = 'amKN12,.。;=-+&^%函数😁♠♣' print(str2) # amKN12,.。;=-+&^%函数😁♠♣
b. 普通字符
str3 = 'ak2你' print(str3) # ak2你
c. 转义字符\t
str4 = 'a\tb123' print(str4)
字符
字符串中每个独立的符号就是字符
转义字符
a. 转义字符是由 \ 和另外一个或者多个符号一起组合而成(转义符一定是\开头)。
b. 在特定的符号前加上 \ ,让这个符号在字符串中具有特殊功能或者特殊意义的字符就是转义字符。
c. 转义字符有哪些是固定的(并不是随便一个字符前加\都可以变成转义字符)
d. 常见的转义字符:
- \n - 换行
str1 = 'abc\n123'
print(str1)
"""
abc
123
"""
- \t - 水平制表符(相当于按tab键)
str1 = '\t床前明月光,\n\t疑是地上霜。\n\t举头望明月,\n\t低头思故乡'
print(str1)
"""
床前明月光,
疑是地上霜。
举头望明月,
低头思故乡
"""
- \’ - 表示一个普通的单引号
# 输出It's me!
# 方法1:
str1 = 'It\'s me!'
print(str1) # It's me!
# 方法2
str1 = "It's me!"
print(str1) # It's me!
- \" - 表示一个普通的双引号
# 输出:I say:"good good study, day day up!"
# 方法1:
str1 = "I say:\"good good study, day day up!\""
print(str1)
# 方法2:
str1 = 'I say:"good good study, day day up!"'
print(str1)
# 输出:1'30"
str1 = '1\'30"'
print(str1) # 1'30"
- \\ - 表示一个普通的反斜杠
# 输出:abc\n123
str1 = 'abc\\n123'
print(str1) # abc\n123
# 输出:c:\study\abc\bin\text.txt
path = 'c:\study\\abc\\bin\\text.txt'
print(path) # c:\study\abc\bin\text.txt
r字符串
r字符串 - 在字符串引号前加 r 或者 R
表示字符串的时候在字符串最前面加 r / R,可以让字符串中所有的转义字符功能消失。(r字符串中所有的字符都是普通字符
str1 = r'abc'
str2 = R'abc'
str3 = r'\tabc\n123'
print(str3) # \tabc\n123
path = r'c:\study\abc\bin\text.txt'
print(path) # 'c:\study\abc\bin\text.txt'
编码字符
所有的字符都可以表示成编码字符
\u四位的十六进制数
str1 = '\u4e00abc一\u0023'
print(str1) # 一abc一#
进制
-
10进制数:由0~9组成的数字:18,16500,22
100,25 -
2进制数:由0和1组成的数字:10000,1100,1011,101
0b1001 -
8进制数:由0~7组成的数字:245,002,777,771,071
0o77 -
16进制数:由0-9和af(AF)组成的数字:1f,abc,4e00,0ff
0x89
字符编码
字符编码
a. 计算机存储数据只能存数字(计算机只具备存储数字的能力)。
b. 为了能够让计算机保存文字信息,就给每一个文本符号对应一个固定的数字,每次在需要存储这个文本符 号时,就存储这个符号对应的数字。这个数字就叫这个符号的编码值。
编码表
编码表 - 保存每个符号对应的编码值的表
-
ASCII码表
总共有128个字符对应的编码值,主要包含:常用的英文符号、数字字符和字母
A - 65
a - 97 -
Unicode编码表 (Python)
Unicode编码表中包含ASCII表
Unicode又叫统一码、万国码,它包含了世界上所有国家所有民族的所有语言的符号。
中文编码:4e00 ~ 9fa5# 中文数量: print(0x9fa5 - 0x4e00) # 20901
编码值的应用
-
chr(编码值)
chr(编码值) - 获取指定编码值对应的字符
print(chr(97)) # a print(chr(0x4e00)) # 一 print(chr(0x9fa5)) # 龥(yù)
-
ord(字符)
ord(字符) - 获取指定字符对应的编码值(编码值以10进制的方式返回值)
注意:字符 - 长度为1的字符串
print(ord('a'), ord('A')) # 97 65 print(ord('余'), ord('婷')) # 20313 23159 print(hex(20313), hex(23159)) # 0x4f59 0x5a77
hex(数字) - 将数字表示成16进制数
案例:将小写字母转换成大写字母
c1 = 'b' result = chr(ord(c1) - 32) print(result) # B
-
编码字符
在字符串中表示字符的方式有两种:直接提供字符,也可以提供一个编码字符。
\u4位的16进制编码值str1 = 'a一龥' str2 = '\u0061\u4e00\u9fa5' print(str1, str2) # a一龥 a一龥
案例:判断c2保存的字符是否是中文
c2 = '看' if '\u4e00' <= c2 <= '\u9fa5': print(c2, '是中文') else: print(c2, '不是中文') # 看 是中文
案例:判断c2保存的字符是否是大写字母
c2 = 'a' if 'A' <= c2 <= 'Z': print('是大写字母') else: print('不是大写字母') # 不是大写字母
两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
print('abc' > '一zzzzashf') # False
字符串基本操作
查
字符串获取元素和列表获取元素的语法一模一样
-
单个查找
message = 'hello python!' print(message[0],message[-1],message[4]) # h ! o print(message[1:-1:2]) # el yhn print(message[1:4:-1]) # '' print(message[2:]) # llo python!
-
遍历
for x in message: print(x) for index in range(len(message)): print(index, message[index]) for index, item in enumerate(message): print(index, item)
+、*
-
字符串1 + 字符串2 - 将两个字符串合并,产生一个新的字符串
str1 = 'abc' str2 = 'hello' result = str1 + str2 print(result) # 'abchello'
-
字符串 * N - 字符串重复N次产生一个新的字符串
result = str1 * 3 print(result) # 'abcabcabc'
in 、not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1
str2 = 'hello'
print('a' in str2) # False
print('h' in str2) # True
print('he' in str2) # True
print('hl' in str2) # False
案例1:统计str1中中文的个数
str1 = '换手机hss8223Kks是sjd==222'
count = 0
for x in str1:
if '一' <= x <= '\u9fa5':
count += 1
print(count)
案例2:提取字符串中所有的大写字母
str2 = '涉及到MJk230023sjkU293shT=='
# ''+'M' -> 'M' + 'J' -> 'MJ' + 'U' -> 'MJU' + 'T' -> 'MJUT'
new_str2 = ''
for x in str2:
if 'A' <= x <= 'Z':
new_str2 += x
print(new_str2) # 'MJUT'