字符串
一、字符编码
-
字符编码:每个符号有对应的固定的数字,这个数字就是这个符号的编码值
-
编码表 - 保存字符和字符对应编码值的表
1)ASCII码表
美国信息码(只包含了美国人常用的符号,总共128个)
数字字符、大写字母(A - 65)、小写字母(a - 97)、英文输入法下的特殊符号
2)Unicode编码表(Python)
Unicode编码表包含了ASCII (前128个字符就是ASCII码表中的内容)
中文编码范围:0x4e00~0x9fa5 -
编码值的应用
1)chr(编码值) - 获取编码值对应的字符
import pypinyin as pinyin print(chr(97)) #'a' print(chr(0x4e00)) #'一' print(chr(0x9fa5)) # '龥' from pypinyin import pinyin for i in range(0x4e00,0x9fa5+1): print(chr(i),pinyin(chr(i)),end='') # for i in range(0x2800,0x28ff+1): # print(chr(i),end='')
2)ord(字符) - 获取指定字符对应的编码值
#注意:字符指的是长度为1的字符串 print(ord('a')) # 97 print(ord('敏')) # 25935 # 案例:将char对应的小写字母转换成大写字母 char = 'a' print(chr(ord(char) - 32)) """ a:97 A: 65 b: 98 B: 66 c: 99 C:67 """
3)编码字符:\u加上4位的16进制编码值
# 在字符串中提供字符的方式有两种:a.直接提供字符 b.使用编码字符 # 十进制转十六进制 - hex(十进制数) - 获取指定数字对应的16进制表示方式 str1 = 'ab' print(str1) # 如果知道字符编码值是多少,但是不知道字符是啥时,就可以使用编码字符来表示这个字符 str2 = '\u0061\u9fa5' print(str2) char = '是' if '\u4e00' <= char <='\u9fa5': print(char, '是中文字符') else: print(char,'不是中文字符')
二、获取字符
字符串获取字符的方法和列表获取元素的方法一样
-
获取单个字符 - 字符串[下标]
注意:转义字符的长度是1
str1 = '\thello\nworld!\u9fa5' print(str1[5]) print(str1[-1]) #龥
-
字符串切片 - 字符串[开始下标:结束下标:步长]
str1 = 'good good study!' print(str1[3:]) print(str1[3:9:3])
-
遍历字符串
str1 = 'good good study!' for i in str1: print(i) for index in range(len(str1)): print(index,str1[index]) for index,item in enumerate(str1): print(index,item)
三、字符串的相关操作
-
字符串加法运算 [字符串拼接]
字符串1+字符串2 - 将两个字符串合并成一个字符串
str1 = 'hello' str2 = 'world' print(str1 + ' ' + str2) # hello world
案例1:提取字符串中所有的数字字符
str1 = '世界上89Kl22.9;;//sh66-==1' new_str1 = '' for i in str1: if '0' <= i <= '9': new_str1 += i print(new_str1) # 89229661
案例2:在每个数字字符后面插入一个 %
str1 = '世界上89Kl22.9;;//sh66-==1' new_str1 = '' for i in str1: if '0' <= i <= '9': new_str1 += i + '%' else: new_str1 += i print(new_str1) # 世界上8%9%Kl2%2%.9%;;//sh6%6%-==1% # 练习:将字符串中所有的数字字符都改成'+' str1 = '世界上89Kl22.9;;//sh66-==1' new_str1 = '' for i in str1: if '0' <= i <= '9': new_str1 += '+' else: new_str1 += i print(new_str1) # 世界上++Kl++.+;;//sh++-==+
-
字符串乘法运算
# 字符串 * N 、N * 字符串 - 让字符串中元素重复N次产生一个新的字符串 str1 = 'a' * 10 print(str1)
-
字符串比较运算
1)比较是否相等: == 、!=
print('abc' == 'bac') #False
2)比较大小 - 两个字符串比较大小,比较的是第一对不相等的字符的编码值的大小
""" 判断字符的性质: 是否是数字字符:'0' <= i <= '9' 是否是小写字母:'a' <= i <= 'z' 是否是大写字母:'A' <= i <= 'Z' 是否是字母:'a' <= i <= 'z' or 'A' <= i <= 'Z' 是否中文:'\u4e00' <= i <= '\u9fa5' """ print('abc' > 'bcc') # 'a' > 'b' , False print('a1mn' > 'abc') # '1' > 'b' , False print('a你好' > 'abc') # '你' > 'b', True
-
in 和 not in
# 字符串1 in 字符串2 - 字符串1是否是字符串2的子串(字符串2是否包含字符串1) print('a' in 'abc') # True print('ab' in 'abc') # True print('ac' in 'abc') # False print(10 in [10, 20, 30]) # True print([10, 20] in [10, 20, 30]) # False
-
相关函数
1)max、min、sorted
print(max('gello')) print(sorted('hellowrld'))
2)len(字符串)
msg = '\thello\nworld!\u9fa5' print(len(msg))
3)str(数据) - 任何数据都可以转换成字符串,对数据的类型没有要求;转换的时候是在数据的打印值外面加引号
str(100) # '100' str(1.23) # '1.23' str(True) # 'True' list1 = [10,20,30,40] str(list1) #'[10, 20, 30, 40]' - 会加上空格-和list1的打印值保持相同的空格 list1 = ["小爷",18,'女'] print(list1) # ['小爷', 18, '女'] str(list1) # "['小爷', 18, '女']"
4) eval(字符串) - 去掉字符串的引号,获取引号中表达式的结果
a = eval('100') # a = 100 b = eval('1.23') # b = 1.23 abc = 100 c = eval('abc') a1 = eval('[10, 20, 30, 40]') # a1 = [10, 20, 30, 40] print(a1) a1.append(100) print(a1) # [10, 20, 30, 40, 100] b1 = eval('10 + 20') # b1 = 10 + 20 print(b1) msg = 'print(100)' eval(msg) a = int(input('请输入数字a的值:')) b = int(input('请输入数字b的值:')) value = input('请选择运算符(+、-、*、/):') result = eval('a' + value + 'b') print(result)
四、字符串的相关方法
语法:字符串.xxx()
-
字符串.join(序列) - 将序列中的元素用指定的字符串连接成一个新的字符串(序列中的元素必须全部都是字符串)
list1 = ['小明', '张三', '李四', '王五'] result = 'and'.join(list1) print(result) # 小明and张三and李四and王五 nums = [90, 78, 67, 45, 23] # 将序列中的元素全部转成字符串['90', '78', '67', ...] # '90 + 78 + 67 + 45 + 23' result = ' + '.join([str(x) for x in nums]) print(result) # '90 + 78 + 67 + 45 + 23' print(eval(result)) # 303
-
字符串.count(字符串2) - 统计字符串1中字符串2的个数
msg = 'how are you? i am fine!thank you,and you?' result = msg.count('you') print(result) # 3
-
字符串.split()
1)字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割
2)字符串1.split(字符串2, N) - 将字符串1中前N个字符串2作为切割点对字符串1进行切割
msg = 'how are you? i am fine! thank you, and you?' result = msg.split('you') print(result) # ['how are ', '? i am fine! thank ', ', and ', '?'] result = msg.split(' ') print(result) # ['how', 'are', 'you?', 'i', 'am', 'fine!', 'thank', 'you,', 'and', 'you?'] date = '2020/6/5' print(date.split('/')) # ['2020', '6', '5'] print(date.split('/',1)) # ['2020','6/5'] result = msg.split(' ', 3) print(result) # ['how', 'are', 'you?', 'i am fine! thank you, and you?'] result = msg.split(' ', 2) print(result) # ['how', 'are', 'you? i am fine! thank you, and you?']
-
字符串1.replace()
1)字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2都替换成字符串3
2)字符串1.replace(字符串2, 字符串3, N) - 将字符串1中前N个字符串2都替换成字符串3
msg = 'how are you? i am fine! thank you, and you?' result = msg.replace('you', 'me') print(result) # how are me? i am fine! thank me, and me? result = msg.replace('you', '') print(result) # how are ? i am fine! thank , and ? msg = 'how are you? i am fine! thank you, and you?' result = msg.replace('you', '+', 2) print(result) # how are +? i am fine! thank +, and you?
-
字符串.strip() - 去掉字符串前后的空白字符
print('---------------------------------------华丽的分割线------------------------------------') msg = """ 'how are you? i am fine! thank you, and you?' """ print(msg.strip()) msg = ' 小明 ' print(msg.strip()) # 小明 msg = '小/明///' print(msg.strip('/'))
-
字符串.isupper() - 判断字符或者字符串是否全是大写字母
#字符串.isupper() - 判断字符串是否是纯大写字母字符串 # 字符.isupper() - 判断字符是否是大写字母 print('JSKS'.isupper()) print('A'.isupper())
-
字符串.islower() - 判断字符或者字符串是否全是小写字母
print('a'.islower()) # True
-
字符串.isdigit() - 判断字符或者字符串是否全是数字字符
print('9'.isdigit()) print('720233'.isdigit())
-
字符串.upper() - 将字符串中的小写字母全部转换成大写字母
print('hs技术上223jKJ90lo'.upper()) # HS技术上223JKJ90LO print('m'.upper())
-
字符串.lower() - 将字符串中的小写字母全部转换成大写字母
print('hAMs技术上223jKJ90lo'.lower()) # hams技术上223jkj90lo print('Q'.lower()) # 案例:判断char是否是字母 char = '2' if char.islower() or char.isupper(): print('是字母') else: print('不是字母') if 'a' <= char <= 'z' or 'A' <= char <= 'Z': print('是字母') else: print('不是字母')
五、格式化字符串
解决的问题:字符串内容不确定
# name = input('请输入学生的名字:')
name = '张三'
# age = int(input('请输入学生的年龄:'))
age = 30
# money = float(input('请输入你的月薪:'))
money = 12000
# xxx今年xx岁,月薪:xxxx.xx元!
-
字符串拼接
msg = name + '今年' + str(age) + '岁,月薪:' + str(money) + '元!' print(msg)
-
格式字符串 - 包含格式占位符的字符串
""" 1)语法:包含格式占位符的字符串 % (数据1, 数据2, 数据3,...) 2)注意:()中的数据必须和前面字符串中的占位符一一对应 3)常见的格式占位符: %s - 可以给任何类型的数据占位 %d - 可以给任何数字占位(整数占位符,如果给的数字是小数,会自动转换成整数在拼接到字符串中) %f - 可以给任何数字占位(浮点数占位符) %.Nf - (控制保留N位小数 - 默认是保留6位小数) """ msg = '%s今年%d岁,月薪:%.2f元!' % (name, age, money) print(msg) result = 'x: %s' % 3.1455 print(result)
-
f-string
""" 在字符串的最前面(引号的前面)加f,就可以在字符串中通过 {表达式} 中表达式的结果来给字符串提供内容 """ msg = f'{name}今年{age}岁,月薪:{money}元!' print(msg) # 张三今年30岁,月薪:12000元! a = 100 b = 20 # 'xxx + xx = xxx' print(f'{a} + {b} = {a+b}') # '100 + 20 = 120' # {表达式:.Nf} - 控制小数保留N位小数 a = 1.234 b = 2.3 print(f'{a:.2f} + {b:.2f} = {a + b:.0f}') # {表达式:.N%} - 控制数字显示成百分比,N空值百分比的小数位数 c = 0.98 print(f'及格率:{c:.0%}') # {表达式:,.Nf} - 标准的金额拼接 # 357800 -> ¥356,800.00 d = 3578000 print(f'¥{d:,.2f}')