d9 字符串
一.字符串和字符
1.什么是字符串(str)
-
它是容器型数据类型:将’‘或者""或者’’’’’'或者""""""作为容器标志,引号中每个符号就是字符串的元素。
-
‘’/"“和’’’’’’/”"""""的区别:在表示字符串内容的时候换行可以不使用转义字符,而是直接按回车
-
字符串元素是不可变的(不支持增删改);字符串是有序的(支持下标操作)
-
元素:引号中每个符号都是字符串的元素(又叫字符),字符可以是任何符号。
- 字符分为两类:普通字符(表示符号本身字符)、转义字符(符号的存在具有特殊的功能和意义)
2.字符串的元素 - 字符
- 字符分为普通字符和转义字符两种
- 转义字符 - 在特定符号前加反斜杠\ 让符号具备特殊的功能
- 常用转义字符:\n - 换行 、\t - 水平制表符(相当于TAB键的功能)、\’ - 表示一个普通的单引号
\" - 表示一个普通的双引号、 \\ - 表示一个普通的反斜杠 - 一个转义字符的长度是1
print('it\'s me!') #it's me!
print("it's me!") #it's me!
# 空串
str1 = ''
print(str1, type(str1), len(str1)) # '' <class 'str'> 0
3.字符编码
- 编码
- 计算机只能直接存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储的。为了能够让计算机具备存储文字符号的能力,我们给所有的文字符号对应一个固定的数据,每次要存储符号的时候就把符号对应的数字存起来,
符号对应的数字就是符号的编码值
- 计算机只能直接存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储的。为了能够让计算机具备存储文字符号的能力,我们给所有的文字符号对应一个固定的数据,每次要存储符号的时候就把符号对应的数字存起来,
- 编码表
- ASCII码表
- 总共有128个字符(美国符号)
- 数字在字母的前面;大写字母在小写字母前;大写字母和小写字母之间有其他符号
- Unicode编码表(Python)
- Unicode编码表是对ASCII表的扩展,包含了世界上所有的国际所有的民族所有的语言的符号(又称万国码),总共65536个
- 中文范围:4e00 ~ 9fa5
- 编码值在Pyhton中的使用
- chr函数:chr(编码值) - 获取编码值对应的字符
- ord函数:ord(字符) - 获取字符的编码值
- 编码字符: \u4e00 (4e00就是1个16进制的编码值)
- 注:python中需要字符的地方都必须使用长度为1的字符串赋值
- ASCII码表
print(chr(97), chr(0x23)) # a #
print(chr(0x4e00)) # 一
print(chr(0x9fa5)) # 龥
print(ord('小')) # 23567
# 练习:将大写字母转换成对应的小写字母
c = 'M'
new_c = chr(ord(c) + 32)
print(new_c)
二.字符串相关操作
1.查 - 获取字符的字符(字符串获取字符的语法和列表获取元素的语法一模一样)
str1 = '\tabc\n123\'+-'
for x in str1:
print(x)
for index in range(len(str1)):
print(index, str1[index])
for index, item in enumerate(str1):
print(index, item)
2.数学运算
# 'ss试试看78,mvn0-k=上课23' -> 'ssmvnk'
str2 = 'ss试试看78,mvn0-k=上课23'
new_str2 = ''
for x in str2:
if 97 <= ord(x) <= 122:
new_str2 += x
print(new_str2) #ssmvnk
3.比较运算符
- 比较是否相等: ==、!=
print('abc' == 'abc') #True
print('abc' == 'acb') #False
- 比较大小:>、<、>=、<= — 两个字符串比较大小,比较的是第一对不相等的字符的编码值的大小
- char = ?
判断是否是数字字符: ‘0’ <= char <= ‘9’
判断是否是小写字母: ‘a’ <= char <= ‘z’
判断是否是大写字母: ‘A’ <= char <= ‘Z’
判断是否是中文: ‘\u4e00’ <= char <= ‘\u9fa5’
- char = ?
str3 = '你好loe--23=sks;M9JHkyu是-12山卡拉'
# 1)统计中文字符的个数
count = 0
for x in str3:
if '\u4e00' <= x <= '\u9fa5':
count += 1
print(count)
# 2)打印字符串中所有的数字字符
for x in str3:
if '0' <= x <= '9':
print(x)
# 3)提取字符串中所有的字母
new_str2= ''
for x in str3:
if 'a' <= x <= 'z' or 'A' <= x <= 'Z':
new_str2 += x
print(new_str2)
4.in 和 not in — 字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('abc' in 'abc123') #True
print('1' in 'abc123') #True
print('ac' in 'abc123') #False
5.r语法 (r-string) - 在字符串的前面加r/R — 如果在字符串前面加r,那么字符串中所有的转义字符的功能都会消失(r功能阻止转义)
str4 = r'abc\n213'
print(str4) #abc\n213
6.相关函数
-
len(字符串)
-
str(数据) - 将数据转换成字符串 (任何类型的数据都可以转换成字符串;转换的时候是在数据的打印值的外面加引号)
-
eval(字符串) - 去掉字符串最外边的引号,获取数据(如果去点引号后是表达式,就计算表达式的结果)
print(str(5 + 5)) #'10'
print(str(100)) #'100'
print(str([10, 20 ,30])) #'[10, 20, 30]'
print(str([1,2,3])) #[1, 2, 3]
print(eval('100'))
print(eval('10 + 20'))
三.字符串相关操作
1.john — 字符串.john(序列) - 将序列中的元素用指定的字符串拼接成一个字符串(序列中的元素必须是字符串)
list1 = ['abc', 'name', '123', 'sfa']
s1 = '-'
s2 = ''
print (s1.join(list1)) #abc-name-123-sfa
print (s2.join(list1)) #abcname123sfa
# 练习:将list2中所有元素拼接成一个字符串
list2 = ['abc', 100, True, 'hello']
print(''.join([str(x) for x in list2]))
# 练习2:将list2中所有的字符串拼接成一个字符串
list2 = ['abc', 100, True, 'hello'] # abchello
print(''.join([x for x in list2 if type(x) == str]))
2.count — 字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数
message = 'how are you? i am fine! thank you! and you?'
print(message.count('you')) # 3
3.index/find
-
字符串1.index(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的)
-
字符串1.find(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置是从0开始的)
-
rindex / rfind - 是从右往左找,找到的是最后一次出现的字符串2
-
在字符串2不存的时候index会报错,find不会报错并且返回-1
print(message.index('you')) # 8
print(message.find('you')) # 8
print(message.rfind('you')) #39
4.split
-
字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割
-
字符串1.split(字符串2, N) - 最多切N次
message = 'mnabc123abcxyzabcoop'
print(message.split('abc')) #['mn', '123', 'xyz', 'oop']
5.replace
-
字符串1.replace(字符串2,字符串3) - 将字符串1中所有的字符串2都替换成字符串3
-
字符串1.replace(字符串2,字符串3, N) - 只替换前N个
message = 'mnabc123abcxyzabcoop'
print(message.replace('abc', 'sb')) #mnsb123sbxyzsboop
print(message.replace('abc', 'sb', 2)) #mnsb123sbxyzabcoop
6.center/rjust/ljust/zfill
-
字符串1.center(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居中
-
字符串1.rjust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居右
-
字符串1.ljust(长度, 填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符填充,原字符串居左
-
字符串1.zfill() == 字符串1.rjust(长度, ‘0’)
str1 = 'abc'
print(str1.center(9, '0')) #000abc000
7.strip/rstrip/lstrip
-
strip - 同时去掉字符串两边的所有的空白
-
rstrip - 同时去掉字符串右边的所有的空白
-
lstrip - 同时去掉字符串左边的所有的空白
-
str2 = '\t abc 123 \n' print(str2) print(str2.strip()) #abc 123
作业
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**
nums = 'abcd1234' print(''.join([x for x in nums[1::2]]))
-
输入用户名,判断用户名是否合法(用户名长度6~10位)
username = input('输入用户名:') if 6 <= len(username) <= 10: print('用户名合法') else: print('用户名不合法')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
username = input('输入用户名:') for x in username: if 'a' <= x <= 'z' or '0' <= x <= '9' or 'A' <= x <= 'Z': continue else: print('用户名不合法') break else: print('用户名合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
username = input('输入用户名:') if 'A' <= username[0] <= 'Z': for x in username[1:]: if 'a' <= x <= 'z' or '0' <= x <= '9' or 'A' <= x <= 'Z': continue else: print('用户名不合法') break else: print('用户名合法') else: print('用户名不合法')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
str1 = 'abc1shj23kls99+2kkk' print(''.join(x for x in str1 if '0' <= x <= '9'))
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
str1 = 'a2h2klm12+' print(str1.upper()) str1 = 'a2h2klm12+' new_str1 = '' for x in str1: if 'a' <= x <= 'z': new_str1 += chr(ord(x) - 32) else: new_str1 += x print(new_str1)
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
stu_num = input('请输入一个小于1000的数字:') print('py1901' + stu_num.zfill(3))
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
str1 = input('输入字符串:') count = 0 for x in str1: if not ('a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9'): count += 1 print(count)
-
输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
str1 = input('输入字符串:') print(str1[1 : -1].center(len(str1), '+'))
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str1 = input('输入字符串:')
if len(str1) % 2 != 0:
print(str1[len(str1) // 2])
else:
print(str1[len(str1) // 2 - 1], str1[len(str1) // 2])
- 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1 = 'how are you? Im fine, Thank you!'
print(str1.find('you'))
print(str1.index('you'))
- 获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = 'abc123'
str2 = 'huak3'
new_str = ''
for i in str1:
if i in str2:
new_str += i
print(new_str)