1.字符串(定义),转义字符,编码相关
1.什么是字符串(str)
字符是容器型数据类型;将’‘、“”、“”“”“”、’‘’‘’'作为容器的标志,里面的每个符号就是字符串的元素
不可变;有序
元素:字符串的元素就是引号中的每一个基本符号。元素又叫字符,字符又分为普通字符和转义字符两种。
2.转义字符
转义字符就是在特定的符号前加\让符号具备特殊的功能或者意义。
\n - 换行,相当于return键
\t - 水平制表符,相当于tab键
’ - 表示一个单引号
" - 表示一个双引号
\ - 表示一个反斜杠
注意:转义字符的长度是1
print('hj8;\n123')
poem = '\t床前明月光,\n\t疑是地上霜。\n\t举头望明月,\n\t低头思故乡。'
print(poem)
# message = 'it's me!' # SyntaxError: invalid syntax
# message = "it's me!" # 方案一
message = 'it\'s me!' # 方案二
print(message)
# message = "I say:"how are you?"" # SyntaxError: invalid syntax
# message = 'I say:"how are you?"'
message = "I say:\"how are you?\""
print(message)
message = 'abc\\n123'
print(message)
file = 'C:\\name\\study\\aa.txt'
print(file)
3.转义字符-编码字符
\u四位的十六进制数 - 表示四位的十六进制数编码值对应的字符
message = 'abc\u4f78=\\u=='
print(message) # abc佸===
4.字符编码
1)字符编码
计算机在存储数据的时候只能存数字(存数字的二进制补码),文本符号是不能直接保存在内存中的,为了能够让计算机存储文本符号,
就给每个符号对应一个固定的数字,在保存符号的时候就去保存这个符号对应的数字。每个符号对应的数字就是这个符号的编码值。
2)编码表 - 记录每个符号对应的编码值的表
a.ASCII码表:
数字字符在字母的前面,编码值从字符0到字符9依次增加;
所有大写字母在所有的小写字母前面;
大写字母和小写字母之间有间隙;
b.Unicode编码表:
Unicode是ASCII码表的扩展,包含了ASCII码表中所有的符号;
包含了所有国家所有民族的所有语言的符号(万国码);
中文范围:4e00 ~ 9fa5
print('\u4eff')
# 1)编码字符: \u4位的16进制编码值
print('a\u0061')
c = '类'
print('\u4e00' <= c <= '\u9fa5')
print('\u28ef\u283f')
3)编码相关的函数
a. chr(编码值) - 获取指定编码对应的字符,返回的数据的类型是字符串
print(chr(97)) # a
print(chr(0x4e00)) # 一
print(chr(0x4e01)) # 丁
for x in range(0x4e00, 0x9fa5+1):
print(chr(x), end=' ')
if x % 30 == 0:
print()
print('===========================')
for x in range(0x1800, 0x18AF+1):
print(chr(x), end=' ')
print()
for x in range(0x4dc0, 0x4dff+1):
print(chr(x), end=' ')
print()
b. ord(字符) - 获取字符编码值(字符用长度是1的字符串表示)
print(hex(ord('余'))) # 20313 0x4f59
print(hex(ord('婷'))) # 23159 0x5a77
##练习: 写一个程序将输入的小写字母字符转换成对应的大写字母
str4=input('请输入字母:')
list5=[chr(ord(x)-32) if 97<=ord(x)<=122 else x for x in str4]
result=''.join(list5)
print(result)
2.字符串相关操作
1.查 - 获取字符
字符串获取字符的方法和列表获取元素的方法一样
str1 = 'python'
print(str1[1]) # 'y'
print(str1[-1]) # 'n'
# print(str1[7]) # IndexError: string index out of range
str2 = 'abc\n123'
print(str2[4]) # 1
print(str1[2:]) # 'thon'
print(str1[1:-1:2]) # 'yh'
print(str1[::-1]) # 'nohtyp'
for x in str1:
print('x:', x)
for index in range(len(str1)):
print(index, str1[index])
2.相关操作
1) +、*
str2 = 'abc'
str3 = 'xyz'
str4 = str2 + str3 # 'abcxyz'
print(str4) # 'abcxyz'
str5 = str2 + '=' + str3
print(str5) # 'abc=xyz'
print(str2 * 3) # 'abcabcabc'
2)
==、!=
print('abc' == 'abc') # True
print('abc' == 'bac') # False
>、<、>=、<=
两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
判断字符是否是小写字母:‘a’ <= char <= ‘z’
判断字符是否是大写字母:‘A’ <= char <= ‘Z’
判断字符是否是字母:‘a’ <= char <= ‘z’ or ‘A’ <= char <= ‘Z’
判断是否是数字字符:‘0’ <= char <= ‘9’
判断是否是中文字符:‘\u4e00’ <= char <= ‘\u9fa5’
练习:统计字符串中数字字符的个数
str0 = 'jsj28海事局389sjj--3sskk9jj'
count = 0
for x in str0:
if '0' <= x <= '9':
count += 1
print('数字的个数:', count)
练习:提取字符中所有的中文字符
‘aj好23l-数据–2啊’ -> ‘好数据啊’
法一:
str1='aj好23l-数据--2啊'
newstr=''
for x in str1:
if '\u4e00'<=x<='9fa5':
newstr+=x
print(newstr)
法二:
str1='aj好23l-数据--2啊'
list1=[x for x in str1 if '\u4e00'<=x<='\u9fa5']
result=''.join(list1)
print(result)
3) in 和 not in
字符 in 字符串 - 判断字符串中是否存在指定的字符
字符串1 in 字符串2 - 判断字符2中是否存在字符串1(判断字符串1是否是字符串2的子串)
print('a' in 'abc') # True
print('ab' in 'abc') # True
print('ac' in 'abc') # False
4)
a. max、min、sorted
b. str
c.len(字符串) - 获取字符串中字符的个数
str(数据) - 将指定数据转换成字符串(所有类型的数据都可以转换成字符串;转换的时候直接在数据的打印值外面加引号)
str(100) # '100'
str([100, 200]) # '[100, 200]'
str({'a': 10, 'b': 20}) # "{'a': 10, 'b': 20}"
print(len('\tabc\n123')) # 8
print(len('\\tabc\n123')) # 9
3.r语法
字符串的最前面加r/R,能够让字符串中所有转义字符的功能消失,字符串中的每个符号都是普通字符
str1 = r'\tabc\n12\\3\''
print(str1) # \tabc\n12\\3\'
path = R'C:\uers\yuting\name\test\aa.txt'
print(path)
3.字符串重要方法
1. 字符串1.count(字符串2) - 返回字符串1中字符串2出现的次数
str1 = 'how are you? i am fine, thank you!'
print(str1.count('h')) # 2
print(str1.count(' ')) # 7
print(str1.count('you')) # 2
2.字符串.join(序列) - 将序列中的元素用指定的字符串拼接产生一个新的字符串。(序列中的元素必须是字符串)
result = '+'.join('abc')
print(result) # a+b+c
result = 'And'.join('hello')
print(result) # hAndeAndlAndlAndo
result = '+'.join(['name', 'age', 'gender'])
print(result) # name+age+gender
result = ''.join(['name', 'age', 'gender'])
print(result) # nameagegender
result = '*'.join({'a': 10, 'b': 20, 'c': 30})
print(result) # a*b*c
练习:
nums = [10, 20, 30, 25, 6] -> ‘102030256’
方法一:
nums = [10, 20, 30, 25, 6]
# 方法一:
result = ''
for x in nums:
result += str(x)
print(result) # 102030256
方法二:
result = ''.join([str(x) for x in nums])
print(result) # 102030256
list1 = [23, 'name', 309.9, 'age', True, 'abc'] # 'name+age+abc'
result = '+'.join([x for x in list1 if type(x) == str])
print(result) # name+age+abc
3.
字符串1.split(字符串2) - 将字符串1中所有字符串2作为切割点对字符串1进行切割,返回的是列表
字符串1.split(字符串2, N) - 将字符串1中前N个字符串2作为切割点,对字符串1进行切割
str1 = 'abc+123+xyz+mn'
result = str1.split('+')
print(result) # ['abc', '123', 'xyz', 'mn']
str2 = 'hejs123斯柯达123000'
result = str2.split('123')
print(result) # ['hejs', '斯柯达', '000']
# 如果切割点连续或者切割点在边界,切割完成后会产生空串
str3 = '+abc+123++xyz+mn+'
result = str3.split('+')
print(result) # ['', 'abc', '123', '', 'xyz', 'mn', '']
str1 = 'abc+123+xyz+mn'
result = str1.split('+', 1)
print(result) # ['abc', '123+xyz+mn']
4.
字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2全部替换成字符串3
字符串1.replace(字符串2, 字符串3, N)
str1 = 'abc+123+xyz+mn'
result = str1.replace('+', '-')
print(result) # abc-123-xyz-mn
3.进制(二/八/十/十六进制)
计算机对于数字的使用主要4种进制:二进制、八进制、十进制和十六进制
1.十进制
基数:0 ~ 9
进位:逢10进1
位权:10的次方数(从0开始) 123 -> 310**0 + 2101 + 1*102 == 123
Python表示:直接写
print(10)
print(123)
2.二进制
基数:0 ~ 1
进位:逢2进1
位权:2的次方数 100 -> 02**0 + 021 + 1*22 == 4
1011 -> 20 + 21 + 2**3 == 11
Python表示:加前缀0b/0B
print(0b1011) # 11
# print(0b1211101) # 报错
3.八进制
基数:0 ~ 7
进位:逢8进1
位权:8的次方数 23 -> 38**0 + 28**1 == 19
Python表示:加前缀0o / 0O
print(0o23)
4.16进制
基数:09,af(A~F)
进位:逢16进1
位权:16的次方数
Python表示:0x/0X af -> 1516**0 + 1016**1 == 175
hex(数字)
print(0xaf) # 175
print(0b1100100) # 100
print(0o144) # 100
print(0x64) # 100
print(hex(97))
作业
- 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入**'abcd1234 ’ ** 输出**‘bd24’**
def index_odd():
str1=input('请输入字符串:')
new_str=''
for _ in range(len(str1)):
if _%2:
new_str+=str1[_]
print(new_str)
index_odd()
方法二:(推导式)
def index_odd2():
str1=input('请输入字符串:')
new_list=[str1[_] for _ in range(len(str1)) if _%2]
result=''.join(new_list)
print(result)
index_odd2()
方法三:
str1=input('请输入字符串:')
print(str1[1::2])
结果:
- 输入用户名,判断用户名是否合法(用户名长度6~10位)
def judge_name():
str1 = input('请输入用户名:')
if 6<=len(str1)<=10:
print('合法!')
else:
print('不合法!')
judge_name()
结果:
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
def judge_name2():
name = input('请输入用户名:')
for x in name:
if not('0'<=x<='9' or 'a'<=x<='z' or 'A'<=x<='Z'):
print('不合法!')
break
else:
print('合法!')
judge_name2()
结果:
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
def judge_name3():
name = input('请输入用户名:')
# 判断首字符是否符合条件,记录bool值
capital=bool('A'<=name[0]<='Z')
#首字符不合法
if capital==False:
print('不合法,首字母需要大写!')
#如果首字符合法,进行后续判断
while capital:
for x in name:
if '0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z':
pass
else:
print('不合法!只能含有数字或者字母!')
return #这里如果写break ,跳不出while循环 ......?
else:
print('合法!')
return
judge_name3()
方法二:(考虑同时要有字母和数字)
def judge_name33():
name = input('请输入用户名:')
if 'A'<=name[0]<='Z':
count=0
for x in name:
if '0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z':
if '0' <= x <= '9':
count+=1
else:
print('不合法,不只含有数字,字母!')
else:
if count>0:
print('合法!')
else:
print('不合法!')
else:
print('不合法,首字符需要大写!')
judge_name33()
结果:
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:‘123992’
方法一:
str1=input('请输入字符串:')
new_str=''
for x in str1:
if '0'<=x<='9':
new_str+=x
print('新字符串为:{}'.format(new_str))
方法二:(推导式+join())
str1=input('请输入字符串:')
new_list=[x for x in str1 if '0'<=x<='9']
result=''.join(new_list)
print(result)
结果:
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 ‘A2H2KLM12+’
方法一:upper()
str1=input('请输入字符串:')
print(str1.upper())
方法二:
str1=input('请输入字符串:')
str_len=len(str1)
new_str=''
for x in str1:
if 'a'<=x<='z':
new_str+=chr(ord(x)-32)
else:
new_str+=x
print(new_str)
方法三:(推导式(三目运算符))
str1=input('请输入字符串:')
new_list=[chr(ord(x)-32) if 'a'<=x<='z' else x for x in str1]
result=''.join(new_list)
print(result)
结果:
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
def stu_nums():
numstr=input('请输入0~999的数字,生成学号:')
num_len=len(numstr)
if num_len==1:
print('py190100'+numstr)
elif num_len==2:
print('py19010'+numstr)
elif num_len==3:
print('py1901' + numstr)
else:
print('输入不合法!')
stu_nums()
方法二:
numstr=input('请输入0~999的数字,生成学号:')
result='py1901'+'0'*(3-len(numstr))+numstr
print(result)
方法三:
字符串.zfill(N) - 将原字符串转换成长度为N的新字符串,不够的在原字符串前加‘0’
num=input('请输入0~999的数字,生成学号:')
new_str='py1901'+num.zfill(3)
print(new_str)
结果:
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**‘===’** 输出:3
方法一:
str1=input('请输入字符串:')
count=0
for x in str1:
if not('0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z'):
count+=1
print('非数字字母的字符的个数为:',count)
方法二:
str1=input('请输入字符串:')
newlist=[x for x in str1 if not('0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z')]
print('非数字字母的字符的个数为:',len(newlist))
结果:
-
输入字符串,将字符串的开头和结尾变成’+',产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+'**
str1=input('请输入字符串:')
print('+'+str1[1:-1]+'+')
结果:
- 输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str1=input('请输入字符串:')
str_len=len(str1)
if str_len%2:
print(str1[str_len//2])
else:
print(str1[(str_len//2)-1:str_len//2+1])
结果:
- 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1=input('请输入字符串1:')
str2=input('请输入字符串2:')
str_len1=len(str1)
str_len2=len(str2)
for i in range(str_len1-str_len2+1):
if str2==str1[i:i+str_len2]:
print(i)
break
# 找不到的情况
else:
print('没有该子串',-1)
结果:
- 获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1=input('请输入字符串1:')
str2=input('请输入字符串2:')
str_len1=len(str1)
str_len2=len(str2)
if str_len1>=str_len2:
new_list = [x for x in str2 if x in str1]
else:
new_list = [x for x in str1 if x in str2]
result=''.join(new_list)
print('公共字符有:',result)
方法二:(集合)
str1=input('请输入字符串1:')
str2=input('请输入字符串2:')
set1=set(str1)
set2=set(str2)
set3=set1&set2
result=''.join(set3)
print('公共字符有:',result)
方法三:
str1=input('请输入字符串1:')
str2=input('请输入字符串2:')
new_str=''
str_len1=len(str1)
str_len2=len(str2)
if str_len1>=str_len2:
for x in str2:
if x in str1 and x not in new_str:
new_str+=x
else:
for x in str1:
if x in str2 and x not in new_str:
new_str += x
print('公共字符有:',new_str)
结果: