元组和字符串
一、元组
-
定义
1.元组是容器类数据类型;将()作为容器的标志,里面多个元素用逗号隔开:(数据1,数据2,数3,…)
2.元组是不可变的(不支持增删改);有序的(支持下标操作)
3.元素:没有要求
4.只有一个元素的元组在表示的时候唯一的元素后面必须加逗号
# 空元组 t1 = () # 只有一个元素的元组在表示的时候唯一的元素后面必须加逗号 # [10],{'a': 10} t2 = (10, ) print(t2, type(t2), len(t2)) # (10,) <class 'tuple'> 1
5.在没有歧义的情况下,元组的()可以省略(直接将多个数据用逗号隔开表示的也是一个元组)
t3 = 10, 20, 30 print(t3, len(t3)) # (10, 20, 30) 3
-
解包 - 使用多个变量直接获取元组,列表中的多个元素
t4 = (10, 20, 30) print(t4[0], t4[1], t4[2]) # 10 20 30 x, y, z = t4 print(x, y, z) # 10 20 30 list1 = [100, 200, 300] for index, item in enumerate(list1): print(index, item) # 0 100 # 1 200 # 2 300 # [(0, 100), (1, 200), (2, 200)] for x, y in enumerate(list1): print(x,y) # 0 100 # 1 200 # 2 300
-
元组就是不可变的列表 - 相关操作除了增删改都可。
t4 = (10, 20, 30) print(t4[-1]) # 30 print(t4[1:]) # (20, 30) print(t4 * 2, t4 + (1, 100)) # (10, 20, 30, 10, 20, 30) (10, 20, 30, 1, 100) print(10 in t4) # True print((10, 20, 30) > (1, 100, 200, 39993)) # True # 等等 # 应用:存储不变的数据 week = ('星期1', '星期2', '星期3', '星期4','星期5', '星期6','星期7')
二、字符串
-
定义
1)字符串是容器类数据类型(字符串对应的容器只能保存多个文字符号 - 字符)。将’’ 或者 " "作为容器的标
志
2)字符串是不可变的(不支持增删改);字符串有序(支持下标)
3)元素:引号中每个符号都是字符串的元素(任何字符都可以是字符串的元素),字符串的元素又叫字符
# 举例 str1 = 'abc,123' str2 = 'abc' # 多行字符串 str3 = """abc""" str4 = '''abc''' # 多行注释只有在特定的位置上才是注释 def func1(): """多行注释""" '''abc''' # 字符串不可变,所有可变操作都是在创建对应的新的字符串 str1 = 'emo' new_str1 = str1.upper() print(str1, new_str1) # emo EMO # 字符串有序 print('abc' == 'bca') # False # 任何文字符号都可以是字符串的元素 str2 = 'amKN12...,;+&^函数' print(str2) # amKN12...,;+&^函数
-
分类
1.普通字符: 符号在字符串中表示它本身
# 普通字符 str3 = 'ak2你' print(str3) # ak2你
2.转义字符 : 符号在字符串中表示特殊含义
# \t是转义字符 str4 = 'a\tb123' print(str4) # a b123
1)转义字符是由 \ 和另外一个或者多个符号一起组合而成(转义符一定是\开头)。在特定的符号前加上\ ,让
这个符号在字符串中具有特殊的功能或者特殊意义的字符就是转义字符。
2)转义字符有哪些是固定(并不是随便一个字符前加\都可以是转义字符)
3)常见的转义字符:
\n: 换行
\t: 水平制表符(相当于按tab键)
\': 表示一个普通的单引号
\": 表示一个普通的双引号
\: 表示一个普通的反斜杠
# \n str1 = 'abc\n123' print(str1) # abc # 123 # \t str1 = '\tabc\n123' print(str1) # abc # 123 str1 = '\t床前明月光,\n\t疑是地上霜。\n\t举头望明月,\n\t低头思故乡。' print(str1) # 床前明月光, # 疑是地上霜。 # 举头望明月, # 低头思故乡。 # \' str1 = 'It\'s me!' print(str1) # It's me! str1 = "It's me!" print(str1) # It's me! # \" str1 = 'I say:"good good study, day day up!"' print(str1) # I say:"good good study, day day up!" str1 = "I say:\"good good study, day day up!\"" print(str1) # I say:"good good study, day day up!" str1 = '1\'30\"' print(str1) # 1'30" # \\ path = 'c:\study\\abc\\bin\\text.txt' print(path) # c:\study\abc\bin\text.txt
3.r字符串: 在字符串引号前加r或者R
如果表示字符串的时候在字符串最前面加r/R,可以让字符串中所有的转义字符功能消失。
(r字符串中所有的字符都是普通字符)
# 不加r str3 = '\tabc\n123' print(str3) # abc # 123 # 加了r str3 = r'\tabc\n123' print(str3) # \tabc\n123
4.编码字符: 所有的字符都可以表示成编码字符
语法:\u四位的十六进制数
str1 = '\u4e00abc--\u0023' print(str1) # 一abc--#
1)10进制数(生活):由0~9组成的数字;18,16500,22 - 100,25
2)2进制数:由0和1组成的数字:10000,1100,1011 ,101 - 0b1001
3)8进制数:由0~7组成的数字:245,002,777,771,071 - 0o1001
4)16进制数:由09和af(A~F)组成的数字:1f、abc、4e00、Off - 0x89
-
字符编码
1.字符编码
计算机存储数据只能存数字(计算机只具备存储数字的能力)为了能够让计算机保存文字信息,就给每一个文
本符号对应一个固定的数字,每次要存储这个文本符号时,就存储这个符号对应的数字。这个数字就叫这个符
号的编码值。
2.编码表 - 保存每个符号对应的编码值得表(百度上有完整的编码表)
1)ASCII码表
总共有128个字符对应的编码值,主要含:常用的英文符号、数字字符、和字母
A - 65;a - 97
2)Unicode编码表(Python)
Unicode编码表中包含ASCII表
Unicode又叫统一码、万国码,它包含了世界上所有国家所有民族的所有语言的符号。
中文编码:4e00 - 9fa5
# 中文大概20901个 print(0x9fa5 - 0x4e00) # 20901
3.编码值的应用
1)chr(编码值):获取指定编码值对应的字符
print(chr(97)) # a print(chr(0x4e00)) # 一 print(chr(0x9fa5)) # 龥(yu')
2)ord(字符):获取指定字符对应的编码值(编码值以10进制的方式返回值)
注意:字符 - 长度为1的字符串
print(ord('a'), ord('A')) # 97 65 # print(ord('钰婷')) # ord() expected a character, but string of length 2 found
3)hex(数字):将数字表示成16进制数
print(hex(20312)) # 0x4f58
4)编码字符
在字符串中表示字符的方式有两种:直接提供字符,也可以提供一个编码字符。
编码字符: \u4位的16进制编码值
str1 = 'a一' str2 = '\u0061\u4e00' print(str1, str2) # a一 a一
5)案例
# 案例1:将小写字母转换成大写字母 c1 = 'm' print(chr(ord(c1) - 32)) # M # 案例2:判断c2保存的字符是否是中文 c2 = '看' if '一' <= c2 <= '\u9fa5': print(c2, '是中文') else: print(c2, '不是中文') # 看 是中文 # 案例3:判断c2保存的字符是否是大写字母 c2 = 'a' if 'A' <= c2 <= 'Z': print(c2, '是大写字母') else: print(c2, '不是大写字母') # a 不是大写字母
-
字符串基本操作
1.比较大小
两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
print('abc' > 'Mzzzashf') # True
2.查
字符串获取元素和列表获取元素的语法一模一样
message = 'hello python' print(message[0], message[-1], message[4]) # h n o print(message[1:-1:2]) # 'el yh' print(message[1:4:-1]) # '' print(message[2:]) # 'llo python' # 遍历查元素 print('==============华丽的分割线===============') for i in message: print(i) print('==============华丽的分割线===============') for index in range(len(message)): print(index, message[index]) print('==============华丽的分割线===============') for index, item in enumerate(message): print(index, item)
3.+、*
字符串1 + 字符串2 - 将两个字符串合并,产生一个新的字符串
字符串 * N - 字符串重复N次产生一个新的字符串
str1 = 'abc' str2 = 'hello' result = str1 + str2 print(result) # abchello result = str1 * 3 print(result) # abcabcabc
4.in 和 not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1
str2 = 'hello' print('a' in str2) # False print('h' in str2) # True print('he' in str2) # True print('hl' in str2) # False
5.案例
# 案例1:统计str1中中文的个数 str1 = '换手机hss8223Kks是sjd==222' count = 0 for i in str1: if '\u0e44' <= i <= '\u9fa5': count += 1 print('str1中中文的个数: ', count) # str1中中文的个数: 4 # 案例2:提取字符串中所有的大写字母 str2 = '涉及到MJk230023sjkU293shT==' # 'MJUT' str2_new = '' for i in str2: if 'A' <= i <= 'Z': str2_new += i print('字符串中所有的大写字母:', str2_new) # 字符串中所有的大写字母: MJUT