字符串和字符
1.什么是字符串(str)
容器型数据类型;将’‘或者’’’ ‘’‘或者""" “”"作为容器的标志,引号中每个符号就是字符串的元素。
(’’’ ‘’'和""" “”"在表示字符串内容的时候换行可以不使用转义字符,而是直接按回车)字符串不可变(不支持增删改);字符串有序(支持下标操作)
元素:引号中的单独的每个符号都是字符串的元素(又叫字符),字符可以是任何符号。
字符分为两类:普通字符(表示符号本身字符)、转义字符(符号的存在具有特殊的功能和意义)
文档开头,函数说明文档,类说明文档是注释
str1 = '100, 90'
str2 = "abc245=-#汉字"
str3 = 'abc\n123'
str4 = '''abc
123'''
str5 = """abc
123
"""
2.字符串的元素 - 字符
字符分为普通字符和转义字符两种
转义字符 - 在特定符号前加\让符号具备特殊的功能,常用转义字符如下:
\n - 换行
\t - 水平制表符(相当于tab键的功能)
’ - 表示一个普通的单引号
" - 表示一个普通的双引号
\ - 表示一个普通的反斜杠#\u4位的十六进制数 - 编码字符
str6 = '\tabc\n12345'
print(str6)
str7 = 'it\'s me!'
str8 = "it's me!"
print(str7)
print(str8)
str9 = 'abc\\name'
print(str9) # abc\name
str10 = 'abc\u4eff'
print(str10) # abc仿
3.字符编码
1.编码
计算机只能直接存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储到计算机中的。
为了能够让计算机具备存储文字符号的能力,我们给所有的文字符号对应了一个固定的数字,每次要存储符号的时候就把符号对应的数字存起来。
符号对应的数字就是符号的编码值。2.编码表 - 保存符号和数字对应关系的表
1)ASCII码表
a.总共有128个字符(美国符号)
b.数字在字母的前面;大写字母在小写字母的前面;大写字母和小写字母之间有其他符号2)Unicode编码表(Python)
a.Unicode编码表是对ASCII表的扩展,包含了世界上所有的国家所有的民族所有语言的符号(又称万国码),总共:65536个
b.中文范围:4e00-9fa53)编码值在Python中的使用
a.chr函数:chr(编码值) - 获取编码值对应的字符b.ord函数:ord(字符) - 获取字符的编码值
c.编码字符:\u4e00(4e00就是一个16进制的编码值)
注意:Python中需要字符的地方都必须使用长度为1的字符串赋值
- chr
print(chr(97)) # a
print(chr(35), chr(0x23)) # # #
num = 0
for x in range(0x4e00, 0x9fa5+1):
print(chr(x), end=' ')
num += 1
if num % 30 == 0:
print()
print()
2)ord
print(ord('余'), ord('婷')) # 20313 23159
练习:将大写字母转换成对应的小写字母
c = 'M'
new_c = chr(ord(c)+32)
print(new_c)
字符串相关操作
1.查 - 获取字符串的字符
字符串获取字符的语法和列表获取元素的语法一模一样
str1 = '\tabc\n123\'+-'
print(str1[1]) # a
print(str1[5:8]) # 123
print(str1[1:]) # 123'+-
for x in str1:
print(x)
for index in range(len(str1)):
print(index, str1[index])
for index, item in enumerate(str1):
print(index, item)
2.数学运算符:+、*
print('hello'+'world') # helloworld
print('hello' * 2) # hellohello
练习:提取字符中小写字母
‘ss试试看78,mvn0-k=上课23’ -> ‘ssmvnk’
str2 = 'ss试试看78,mvn0-k=上课23'
new_str2 = ''
for x in str2:
if 97 <= ord(x) <= 122:
new_str2 += x
print(new_str2)
3.比较运算符
1)比较是否相等:==、!=
print('abc' == 'abc') # True
print('abc' == 'acb') # False
2)比较大小:>、<、>=、<=
两个字符串比较大小,比较第一对不相等的字符编码值的大小
char = ?
判断是否是数字字符:‘0’ <= char <= ‘9’
判断是否是小写字母:‘a’ <= char <= ‘z’
判断是否是大写字母:‘A’ <= char <= ‘Z’
判断是否是字母:‘a’ <= char <= ‘z’ or ‘A’ <= char <= ‘Z’
判断是否是中文:’\u4e00’ <= char <= ‘\u9fa5’
print('MNxy' > 'ab') # False
print('你好吗' > 'hello') # True
print('123' > 'KM123') # False
练习2:
str3 = '你好loe--23=sks;M9JHkyu是-12山卡拉'
# 1)统计中文字符的个数
count = 0
for i in str3:
if '\u4e00' <= i <= '\u9fa5':
count += 1
print(count)
# 2)打印字符串中所有的数字字符
for i in str3:
if '0' <= i <= '9':
print(i)
# 3)提取字符串中所有的字母
new_str = ''
for i in str3:
if 'a' <= i <= 'z' or 'A' <= i <= 'Z':
new_str += i
print(new_str)
4. in 和 not index
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('1' in 'abc124') # True
print('abc' in 'abc124') # True
print(10 in [10, 20, 30]) # True
print([10, 20] in [10, 20, 30]) # False
print('ac' in 'abc123') # False
5.r语法(r-string) - 在字符串的前面加r
如果在字符串前面加r,那么字符串中所有的转义符的功能都会消失。(阻止转义)
str4 = r'abc\n123'
print(str4)
path = r'D:\QianFeng\02语言基础\day9-字符串'
print(path)
6.相关函数
len(字符串)
str(数据) - 将数据转换成字符串(任何类型的数据都可以转换成字符串;转换的时候是在数据的打印值外面加引号)
eval(字符串) - 去掉字符串最外面的引号,获取数据(如果去掉引号后不是一个数据,就计算表达式的结果)
print(str(100)) # '100'
print(str([10, 20, 30])) # '[10, 20, 30]'
print(str([10,20,30])) # '[10, 20, 30]'
print(str({'a': 10, 'b': 20})) # "{'a': 10, 'b': 20}"
print(str(lambda x: x*2)) # '<function <lambda> at 0x000001AADE7E0820>'
result1 = eval('100')
print(result1, type(result1)) # 100 <class 'int'>
result2 = eval('10+20')
print(result2) # 30
字符串相关方法
1.join
字符串.join(序列) - 将序列中的元素用指定的字符串拼接成一个字符串(序列中的元素必须是字符串)
list1 = ['abc', 'name', '123', 'sdf']
result = ''.join(list1)
print(result) # abcname123sdf
result1 = '+'.join(list1)
print(result) # abc+name+123+sdf
result2 = '123'.join('abc')
print(result2) # a123b123c
# 练习1:将list2中所有元素拼接成一个字符串
list2 = ['abc', 100, True, 'hello']
result3 = ''.join([str(x) for x in list2])
print(result3) # abc100Truehello
# 练习2:将list2中所有的字符串拼接成一个字符串
list2 = ['abc', 100, True, 'hello']
result4 = ''.join([x for x in list2 if type(x) == str])
print(result4) # abchello
2.count
字符串1.index(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置从0开始的下标值)
字符串1.find(字符串2) - 获取字符串2第一次出现在字符串1中的位置(位置从0开始的下标值)
在字符串2不存在的时候index会报错,find不会报错并返回-1
rindex/rfind - 是从右往左找,找到的是最后一个字符串2
result6 = message.index('you')
print(result6) # 8
result7 = message.find('you')
print(result7) # 8
result8 = message.rfind('you')
print(result8) # 39
4.split
字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割
字符串1.split(字符串2,N) - 最多切N次
注意:无论切割点怎么分布,切完后小字符串的个数都是切割点的数量加1
message = 'mnabc123abcxyzabcoop'
result9 = message.split('abc')
print(result9) # ['mn', '123', 'xyz', 'oop']
message = 'mnabc123abcxyzabcoop'
result10 = message.split('abc', 1)
print(result10) # ['mn', '123abcxyzabcoop']
5.replace
字符串1.replace(字符串2,字符串3) - 将字符串1中所有字符串2都替换成字符串3
字符串1.replace(字符串2,字符串3,N) - 只替换前N个
message = 'how are you? i am fine! thank you! and you?'
result11 = message.replace('you', 'me')
print(result11) # how are me? i am fine! thank me! and me?
message = 'how are you? i am fine! thank you! and you?'
result12 = message.replace('you', 'me', 2)
print(result12) # how are me? i am fine! thank me! and you?
6.center\rjust\ljust\zfill
字符串1.center(长度,填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符串填充,原字符串居中显示
字符串1.rjust(长度,填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符串填充,原字符串居右显示
字符串1.ljust(长度,填充字符) - 将字符串1转换成指定长度的新字符串,不够的用指定字符串填充,原字符串居左显示
字符串1.zfill(长度) == 字符串1.rjust(长度,‘0’)
str1 = 'abc'
print(str1.center(9, '0')) # 000abc000
print(str1.center(8, 'x')) # xxabcxxx
print(str1.rjust(9, '0')) # 000000abc
print(str1.ljust(9, '0')) # abc000000
7.strip/rstrip/lstrip
strip - 同时去掉字符串两边的所有的空白
rstrip - 去掉字符串右边的所有空白
lstrip - 去掉字符串左边的所有空白
str2 = '\t abc 123 \n'
print(str2) #| abc 123
print(str2.strip()) #|abc 123|
print(str2.rstrip()) #|abc 123 |
print(str2.lstrip()) #| abc 123|
作业
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**
str = 'abcd1234' print(str[1::2])
-
输入用户名,判断用户名是否合法(用户名长度6~10位)
username = len(input('请输入用户名:')) if 6 <= username <= 10: print('输入成功') else: print('长度不匹配')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
username = input('请输入用户名:') if '0' <= username <= '9' or 'a' <= username <= 'z' or 'A' <= username <= 'Z': print('合法') else: print('不合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
username = input('用户名:') if 'A' <= username[0] <= 'Z': for i in username: if not ('1' <= i <= '9' or 'A' <= i <= 'Z' or 'a' <= i <= 'z'): print('不合法') break else: print('合法') else: print('不合法,第一个字母必须是大写字母')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
str1 = 'abc1shj23kls99+2kkk' new_str1 = '' for i in str1: if '0' <= i <= '9': new_str1 += i print(new_str1)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
str1 = 'a2h2klm12+' new_str1 = str1.upper() print(new_str1) str1 = 'a2h2klm12+' new_str1 = '' for i in str1: num1 = ord(i) if ord('a') <= num1 <= ord('z'): num1 -= 32 new_str1 += chr(num1) else: new_str1 += i print(new_str1)
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
input1 = str(input('输入小于1000的数字:')) new_input1 = input1.rjust(3, '0') last_new_input1 = 'py1901'+new_input1 print(last_new_input1)
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
str1 = input('输入一个字符串:') count = 0 for i in str1: if 'A' <= i <= 'Z' or '0' <= i <= '9' or 'a' <= i <= 'z': continue else: count += 1 print(count)
-
输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
str1 = input('输入一个字符串:') str1 = str1.replace(str1[0], '+') str1 = str1.replace(str1[-1], '+') print(str1)
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
s = input('输入一个字符串:')
i = len(s) // 2
if len(s) % 2:
print(s[i])
else:
print(s[i-1: i+1])
- 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1 = 'how are you? Im fine, Thank you!'
result = str1.find('you')
result1 = str1.index('you')
print(result)
print(result1)
- 获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = 'abc123'
str2 = 'huak3'
str3 = ''
result = set(str1) & set(str2)
for i in result:
str3 += str(i)
print(str3)