学习总结:
1. 元组
-
元组是容器型数据类型;将()作为容器的标注,里面多个元素用逗号隔开:(数据1,数据2,数据3,…)
-
元组不可变的(不支持增删改)
-
元素没有要求
-
空元组:t1 = ()
- 只有一个元素的元组在表示的时候,唯一的元素后面必须加逗号。例如:t2 = (10,)
-
在没有歧义的情况下,元组的()可以省略(直接将多个数据用逗号隔开表示的也是一个元组。)
-
解包:使用多个变量直接获取元组,列表中的多个元素
t4 = (10,20,30) x,y,z = t4 print(x,y,z) # 10,20,30
-
元组是不可变的列表
2. 字符串
-
容器型数据类型(字符串对应的容器只能保存多个文字符号 - 字符)。将""或者’'作为容器的标志;字符串有序(支持下标)
-
字符串不可变,所有的可变操作都是在创建对应的新的字符串。
-
转义字符:(常见的转义字符):
- \n:换行
- \t:水平制表符(相当于tab键)
- \':表示一个普通的单引号
- \":表示一个普通的双引号
- \\:表示一个普通的反斜杠 (防止一个普通的变成一个转义字符。)
-
r 字符串:在字符串引号前加 r 或者 R(可以让字符串中所有的转义字符功能消失,r 字符串中所有的字符都是普通字符)写路径是很好用:
path = r'c:\study\abc\bin\text.txt'
-
编码字符: \u 四的十六进制数。
-
str1 = "\u5a6eabc一\u3a8f" print(str1) # 婮abc一㪏
-
十六进制数:由09和af(A~F)组成的数字,4e00
-
二进制数:由0和1组成,0010,1111,1101,Python中写作0b1101
3. 字符编码
-
计算机存储数据只能存数字(计算机只具备存储数字的能力)
-
为了能够让计算机保存文字信息,就给每一个文字符号对应一个固定的数字,每次在需要存储这个文本符号,就存储这个符号的对应数字,这个数字就叫这个符号的编码值。例如,a ----> 97,b ---->98,c ---->99>。
-
Unicode编码表(Python)
- Unicode编码表中包含ASCII码表
- 包含了世界上所有国家所有民族的所有语言的符号。
- 中文编码:4e00 ~ 9fa5,比如0x4e00
-
编码值的应用
-
chr(编码值) :获取指定编码值对应的字符
print(chr(97)) # a print(chr(0x4e00)) # 一 for i in range(0x0E00,0x0E7F+1): print(chr(i),end=" ") # 泰语字符对应的编码值
-
ord(字符):获取指定字符对应的编码值(编码值以十进制的方式返回值);;
- 注意:字符 - 长度为1的字符(不是字符串)
-
案例1:大小写字母相互转换
c1 = "n" c2 = chr(ord(c1)-32) print(c2) # N 转换小写 c1 = "M" c2 = chr(ord(c1)+32) print(c2) # m 转换大写
-
案例2:判断c3保存的是不是中文
c3 = "五" if "一" <= c3 <= "\u9fa5": print(c3,"是中文") else: print(c3,"不是中文") # 五 是中文
-
案例3:判断c4保存的是不是大写字母
c4 = "M" if "A" <= c4 <= "Z": print(c4,"是大写字母") else: print(c4,"不是大写字母") # M 是大写字母
-
字符串操作
-
获取元素:字符串获取元素和列表获取元素的语法一模一样,可以单个获取,可以切片。
-
+,* :(字符串1+字符串2)将两个字符串合并,产生一个新的字符串;(字符串*N)字符串重复N次产生一个新的字符串。
-
in 和 not in:(字符串1 in 字符串2)判断字符串2是否包含字符串1;(字符串1 not in 字符串2)判断字符串是否不包含字符串1。
-
综合案例:
# 案例:提取字符串中所有的大写字母 str2 = '涉及到MJk23002NOnfnfi' str3 = "" for i in str2: if "A" <= i <= "Z": str3 += i print(str3) # MJKNO # 案例:统计str1中中文的个数 str1 = '换手机hss8223Kks是sjd==222' count = 0 for i in str1: if "\u4e00" <= i <= "\u9fa5": count += 1 print(count) # 4
-
-