字符串
1、什么是什么是字符串(str)
字符串是容器型数据类型:将 ‘‘或者""或者’’’’’‘或者""""""作为容器标志,引号中的每个符号就是字符串的元素。
(’’’’’'和""""""在表示字符串内容的时候换行可以不使用转义字符,而是直接按回车)
字符串不可变(不支持增删改):字符串有序(支持下标操作)
元素:引号中的单独的每个符号都是字符的元素(又叫字符),字符可以任何符号。
字符分为两类:普通字符(表示字符自身的字符) 转义字符(有不同含义的字符)
str1 = '90,100'
str2 = "abc76=-+大是大非😀"
str3 = 'abv\n123'
str4 = '''abc
4531
'''
str5 = """abc
12-
yf
"""
str6 = 'abc123'
2、什么是字符
"""
字符分为普通字符和转义字符两种
转义字符 - 在特定符号前面/加符号具备特殊的功能,常用转义字符如下:
\n - 换行
\t - 水平制表符(想当于tab键的功能)
\' - 表示一个普通的单引号
\" - 表示一个普通的双引号
\\ - 表示一个普通的反斜杠
一个转义字符的长度是1
"""
# \u4为的十六进制数 - 编码字符
str7 = '\tabc\n123'
print(str7)
str8 = "it's me!"
print(str8)
str9 = 'it\'s me!'
print(str9)
str10 = '\u4e00'
print(str10)
3、字符编码
"""
1.编码
计算机只能存储数字(而且保存的数字的二进制的补码), 文字符号是无法直接存储到计算机中的。
为了能够计算具备存储文字符号的能力,我们给所有的文字符号对应的一个固定的数字,每次都存储符号的时候就把字符对应的数字存起来。
符号对应的数字就是符号的编码值
2.编码表 - 保存符号和数字对应关系的表
1)ASCII码表
a.总共有128个字符(美国符号)
b.数字在字母的前面:大写字母在小写字母前面:大写字母和小写字母之间有其他符号
2)Unicode编码表(pyhton)
a.Unicode编码表是对ASCII表的扩展,包含了世界上所有国家民族的所有语言的符号(又叫万国码),总共65536万多
b.中文范围:4e00 - 9fa5
3)编码值在python中的使用
a.chr函数:chr(编码值) - 获取编码值对应的字符
b.ord函数:ord(字符) - 获取字符的编码值
c.编码字符:\u4e00(4e00就是一个16进制的编码值)
注意:python中需要字符的地方都必须使用长度为1的字符串赋值
"""
# 1) chr
print(chr(97))
print(chr(35), chr(0x23))
print(chr(0x4e00))
print(chr(0x9fa5))
num1 = 0
for i in range(0x4e00, 0x9fa5+1):
print(chr(i), end=' ')
num1 += 1
if num1 % 30 == 0:
print()
print()
# 2)ord
print(ord('王'), ord('茂')) # 29579 # 33538
# 练习:将大写字母转换成对应的小写字母
c = 'M'
print(chr(ord(c)+32))
str11 = 'abc\u5fdd-\u002b-\ua000'
print(str11)
4、字符串的相关操作
1)查 - 获取字符串的字符
符串获取字符的语法和列表获取元素的语法一样
str1 = '\tabc\n123\'+-'
print(str1[1])
print(str1[-1])
print(str1[5: 8], str1[5: -3])
print(str1[1:])
print(str1[::-1])
for i in str1:
print(i)
for i in range(len(str1)):
print(i, str1[i])
for index, item in enumerate(str1):
print(index, item)
2)数学运算符: +、*
print('hello' + 'world!') # helloworld!
name = '小明'
print('姓名:' + name) # 姓名:小明
# 练习:提取字符串中的小写字母
# 'ss试试看78,mvn0-k=上课23' -> 'ssmvnk'
str2 = 'ss试试看78,mvn0-k=上课23'
new_str2 = ''
for x in str2:
if 'a' <= x <= 'z':
new_str2 += x
print(new_str2) # ssmvnk
new_str2 = [x for x in str2 if 'a' <= x <= 'z']
print(new_str2) # ['s', 's', 'm', 'v', 'n', 'k']
3)比较运算符
# 1)比较是否相等: ==、!=
print('abc' == 'abc') # True
print('abc' == 'bac') # False
# 2)比较大小:>,<,>=,<=
# 两个字符串比较大小,比较的是第一对不相等的字符的编码值的大小
"""
char = ?
判断是否是数字字符: '0' <= char <= '9'
判断是否是小写字母: 'a' <= char <= 'z'
判断是否是大写字母: 'A' <= char <= 'Z'
判断是否是字母: 'A' <= char <= 'Z' or 'a' <= char <= 'z'
判断是否是中文: '\u4e00' <= char <= '\u9fa5'
"""
print('MDDSA' > 'dsa') # False
print('你好码' > 'asd') # True
print('123' > 'asda') # False
# 练习2:
# 1)统计中文字符的个数
# 2)打印字符串中所有的数字字符
# 3)提取字符中所有的字母
str3 = '你好loe--23=sks;M9JHkyu是-12山卡拉'
num = len([x for x in str3 if '\u4e00' <= x <= '\u9fa5'])
print(num)
num1 = ''.join([x for x in str3 if '0' <= x <= '9'])
print(num1)
num2 = ''.join([x for x in str3 if 'A' <= x <= 'Z' or 'a' <= x <= 'z'])
print(num2)
4)n 和 not in
# 字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('1' in 'abc123') # True
print('abc' in 'abc13') # True
print(10 in [10, 20]) # True
print([10, 20] in [10, 20, 30]) # False
print('ac' in 'abc123') # False
5)r语法(r-string) - 在字符串的前面加r/R
# 如果在字符串前面加r,那么字符串中所有的转义字符的功能都会消失。
str4 = r'abc\n123'
print(str4) # abc\n123
6)相关函数
"""
len(字符串)
str(数据) - 将数据转换成字符串 (任何类型的数据都可以转换成字符串:转换的时候是在数据的打印值的外面加引号)
eval(字符串) - 去掉字符串外面的引号,获取数据(如果去掉引号后不是一个数据,就计算表达式的结果)
"""
str(100) # '100'
str(12.2) # '12.5'
str([10, 20, 30]) # '[10, 20, 30]'
str([1, 2, 3]) # '[1, 2, 3]'
str({'a': 1, 'b': 2}) # "{'a': 1, 'b': 2}"
str({'a': 1, "b": 2}) # "{'a': 1, 'b': 2}"
str(lambda x: x*2) # '<function <lambda> at 0x0000029527B6A160>'
print(eval('100'))
print(eval('100 + 200'))
str5 = """{
'student':[
{'name': '小明', 'age': 18},
{'name': '张三', 'age': 20},
],
'name': 'python2104'
}"""
result4 = eval(str5)
print(result4, result4['student'][0])
5、字符串的相关方法
字符串.join(序列) - 将序列中的元素用指定的字符串拼接成一个字符串 (序列中的元素必须是字符串)
字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数
字符串1.count(字符串2) - 统计字符串2第一次出现在字符1中的位置(位置是从0开始的下标)
字符串1.find(字符串2) - 统计字符串2第一次出现在字符1中的位置(位置是从0开始的下标)
在字符串2不存在的时候index会报错,find不会但报错返回-1
字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割
字符串1.split(字符串2, n) - 将字符串1中前N个字符串2作为切割点对字符串1进行切割
注意:无论切割点你怎么分布,切完后小字符串的个数都是切割点的数量加1
字符串1.replace(字符串2,字符串3) - 将字符串1中的字符串2都替换成字符串3
字符串1.replace(字符串2,字符串3, N) - 只替换前N个
字符串1.center(长度,填充字符) - 将字符串1转换成指定长度的新字符,不够的用指定字符填充,原字符串居中显示
字符串1.rjust(长度,填充字符) - 将字符串1转换成指定长度的新字符,不够的用指定字符填充,原字符串居右显示
字符串1.ljust(长度,填充字符) - 将字符串1转换成指定长度的新字符,不够的用指定字符填充,原字符串居左显示
字符串1.zfill(长度) == 字符串1.rjust(长度,‘0’)
字符串1.strip - 同时去掉字符串两边的所有的空白
字符串1.rstrip - 去掉字符串右边的所有的空白
字符串1.lstrip - 去掉字符串左边的所有的空白
字符串方法太多,不一一列举详情请点击**链接**。
# 1.join
# 字符串.join(序列) - 将序列中的元素用指定的字符串拼接成一个字符串 (序列中的元素必须是字符串)
list1 = ['abc', 'name', '123', 'sdf']
result = ''.join(list1)
print(result) # abcname123sdf
result1 = '+'.join(list1)
print(result1) # abc+name+123+sdf
result2 = '123'.join('abc')
print(result2) # a123b123c
list2 = ['abc', 1000, True, 'sdf']
result3 = ''.join([str(x) for x in list2])
print(result3) # abc1000Truesdf
# 练习2:将list2中所有的字符串拼接成一个字符串
list2 = ['abc', 100, True, 'hello'] # abchello
result3 = ''.join([x for x in list2 if str == type(x)])
print(result3) # abchello
# 2.count
# 字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数
message = 'how are you? i am fine! thank you! and you?'
result5 = message.count('you')
print(result5) # 3
# 3.index/find
# 字符串1.count(字符串2) - 统计字符串2第一次出现在字符1中的位置(位置是从0开始的下标)
# 字符串1.find(字符串2) - 统计字符串2第一次出现在字符1中的位置(位置是从0开始的下标)
# 在字符串2不存在的时候index会报错,find不会但报错返回-1
# rindex/rfind 从后往前取
result6 = message.index('you')
print(result6) # 8
result7 = message.find('you')
print(result7) # 8
result8 = message.rindex('you')
print(result8) # 39
# 4.split
# 字符串1.split(字符串2) - 将字符串1中所有的字符串2作为切割点对字符串1进行切割
# 字符串1.split(字符串2, n) - 将字符串1中前N个字符串2作为切割点对字符串1进行切割
# 注意:无论切割点你怎么分布,切完后小字符串的个数都是切割点的数量加1
message = 'mnabc123abcxyzabcoop'
result9 = message.split('abc')
print(result9) # ['mn', '123', 'xyz', 'oop']
message = 'abcmnabc123abcabcxyzabcoopabc'
print(message.split('abc')) # ['', 'mn', '123', '', 'xyz', 'oop', '']
message = 'mnabc123abcxyzabcoop'
print(message.split('abc', 1)) # ['mn', '123abcxyzabcoop']
# 5.replace
# 字符串1.replace(字符串2,字符串3) - 将字符串1中的字符串2都替换成字符串3
# 字符串1.replace(字符串2,字符串3, N) - 只替换前N个
message = 'how are you? i am fine! thank you! and you?'
result10 = message.replace('you', 'me')
print(result10) # how are me? i am fine! thank me! and me?
result11 = message.replace('you', 'me', 2)
print(result11) # how are me? i am fine! thank me! and you?
# 6.center\rjust\ljust\zfill
# 字符串1.center(长度,填充字符) - 将字符串1转换成指定长度的新字符,不够的用指定字符填充,原字符串居中显示
# 字符串1.rjust(长度,填充字符) - 将字符串1转换成指定长度的新字符,不够的用指定字符填充,原字符串居右显示
# 字符串1.ljust(长度,填充字符) - 将字符串1转换成指定长度的新字符,不够的用指定字符填充,原字符串居左显示
# 字符串1.zfill(长度) == 字符串1.rjust(长度,'0')
str1 = 'abc'
print(str1.center(7, '*')) #**abc**
print(str1.rjust(7)) # abc
print(str1.ljust(7)) # abc
print(str1.zfill(7)) # 0000abc
# 7.strip/rstrip/lstrip
# strip - 同时去掉字符串两边的所有的空白
# rstrip - 去掉字符串右边的所有的空白
# lstrip - 去掉字符串左边的所有的空白
str2 = ' t ac 123 '
print('-----------原字符串-----------')
print(str2.strip())
print('-----------------------------')
print(str2.rstrip())
print('-----------------------------')
print(str2.lstrip())
print('-----------------------------')
6、练习
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**
str1 = input('请输入一个字符串:') print(str1[1::2])
-
输入用户名,判断用户名是否合法(用户名长度6~10位)
while 1: str1 = input('请输入您的用户名(6-10位):') if len(str1) < 6 or len(str1) > 10: print('您输入的用户名不合法,请您重新输入!') continue else: break
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
while 1: str1 = input('请输入您的用户名(用户名中只能由数字和字母组成):') for i in str1: if '0' <= i <= '9' or 'a' <= i <= 'z' or 'A' <= i <= 'Z': continue else: break else: print('您输入的用户名合法!') break print('您输入的用户名不合法,请您重新输入!')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
while 1: str1 = input('请输入您的用户名(用户名中只能由数字和字母组成,并且第一个字符必须是大写字母):') a = True for i in str1: if '0' <= i <= '9' or 'a' <= i <= 'z' or 'A' <= i <= 'Z': continue else: a = False break if a and not(str1[1:].isalpha()) and ('A' <= str1[0] <= 'Z'): print('您输入的用户名合法!') break else: print('您输入的用户名不合法,请您重新输入!') continue
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
str1 = input('请输入一个字符串:') str2 = ''.join([x for x in str1 if '0' <= x <= '9']) print(str2)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
方法1 str1 = input('请输入一个字符串:') print(str1.upper()) 方法2 str1 = input('请输入一个字符串:') str2 = ''.join([chr(ord(x) - 32) if 'a' <= x <= 'z' else x for x in str1]) print(str2)
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
str1 = input('请输入一个小于1000的数字:') str2 = 'py1901'+str1.zfill(3) print(str2)
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
str1 = input('请输入一个字符串:') str2 = len([x for x in str1 if not('0' <= x <= '9') and not('A' <= x <= 'Z' or 'a' <= x <= 'z')]) print(str2)
-
输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
str1 = input('请输入一个字符串:') str2 = '+' + str1[1:len(str1)-1] + '+' print(str2)
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
import math
str1 = input('请输入一个字符串:')
n = len(str1) / 2
print(str1[math.ceil(n - 1):int(n) + 1])
- 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1 = 'how are you? Im fine, Thank you!'
str2 = 'you'
for i in range(len(str1) - len(str2) + 1):
if str1[i:i+len(str2)] == str2:
print(i)
break
else:
print(-1)
- 获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = 'abc123'
str2 = 'huak3'
print(''.join(set(str1) & set(str2)))