一、字符串基础
1.什么是字符串(str)
“”"
字符串是容器型数据类型,将单引号或者双引号作为容器的标志,元素不需要用逗号隔开:‘元素1元素2元素3…’
字符串是不可变的(不支持增删改),字符串是有序的(支持下标操作)
字符串中的元素:只能是文本符号(所有计算机能表达出来的符号都可以作为字符串的元素),一个符号对应一个元素
字符串中每一个独立的元素又叫’字符’,python中只有字符的概念,没有字符对应的数据类型
“”"
空串
str1 = ''
str2 =""
str3 = """"""
print(type(str1), type(str2), type(str3))
非空字符串
str1 = 'abc'
str2 ="你好"
str3 = """hello,你好"""
2.字符(字符串中的元素)
‘’
字符串中的字符分两种:普通字符,转义字符
1)普通字符 - 除了转义字符以外的字符
2)转义字符 - 在指定符号前加\用来表示一些特殊功能和特殊意义的字符
\n - 换行
\t - 制表符(按tab键)
’ - 单引号
" - 双引号
\ - 反斜杠
“”"
编码字符:\u4位的16进制数
str4 = '\u4e00abc\u7800'
print(str4, len(str4))
注意:计算转义字符长度的时候,一个转义字符的长度是1
3)阻止转义
在字符串的最前面加r/R,那么这个字符串中的所有转义字符都无效
应用1:windows路径
path = r'c\nan\temp'
print(path)
二、字符编码
1.什么是字符编码
计算机在存数据的时候只能存数字,而且存的数字是补码
为了能够让计算机存储文本数据,给每个字符关联了一个固定的数字,用来对这个字符进行存储,每个字符关联的那个数字就是这个字符的编码值
2.编码表
1)ASCII码标:用1个字节来对字符进行编码(码值范围:0 - 127)
a.数字在字母前面(字符0 - 字符9的编码值连续递增)
b.大写字母在小写字母前面(字母之间连续递增)
c.大写字母和小写字母之间有其他符号(不是连续的)
2)Unicode编码标
Unicode编码标是对ASCII码标的扩展(Unicode编码标中包含了ASCII编码标中所有的符号)
Unicode编码标中包含了世界上所有国家所有民族所有语言的符号,总共65536个
中文范围:4e00 - 9fa5
1)chr函数
chr(编码值) - 获取指定编码值对应的字符
打印所有的中文
count = 0
for x in range(0x4e00,0x9fa5):
print(chr(x), end=' ')
count += 1
if count % 50 == 0:
print()
print()
2)ord函数
ord(字符) - 获取指定字符对应的编码值
print(ord('亮'))
3)编码字符
str4 = '\u4e00你好!'
print(str4)
三、字符串相关操作
1.获取字符串中的元素(获取字符)
字符串获取元素和列表获取元素的语法一样
str1 = 'how are you!'
1)获取单个元素
print(str1[2])
print(str1[-1])
2)切片
print(str1[1:5]) # 'ow a'
print(str1[-3::-1]) # 'oy era woh'
3)遍历
for x in str1:
print(x)
for index in range(len(str1)):
print(str1[index])
2.+, *
字符串1 + 字符串2
字符串 * N / N * 字符串
str1 = 'abc'
str2 = '123'
print(str1 + str2) # 'abc123'
print(str1 * 2) # 'abcabc'
3.==, !=
print(str1 == 'abc') # True
print(str1 == 'bca') # False
4.>, <, >=, <=(针对两个字符串)
两个字符串比较大小:比较的是第一组不相等的字符的编码值大小
str3 = 'zABC'
str4 = 'z1abc'
print(str3 > str4) # True
应用:
判断是否是数字字符:‘0’ <= char <= ‘9’
判断是否是小写字母:‘a’ <= char <= ‘z’
判断是否是大写字母:‘A’ <= char <= ‘Z’
判断是否是字母:‘a’ <= char <= ‘z’ or ‘A’ <= char <= ‘Z’
判断是否是中文字符:’\u4e00’ <= char <= ‘\u9fa5’
练习1:输入一个字符串,统计字符串中字母和中文的个数
str5 = 'Hello,王红亮'
count1 = 0
count2 = 0
for x in str5:
if 'a' <= x <= 'z'or 'A' <= x <= 'Z':
count1 += 1
elif '\u4e00' <= x <= '\u9fa5':
count2 += 1
print('字母个数:', count1, '中文个数:', count2)
练习2:判断输入的字符串是否是纯数字字符串
str6 = '242142'
for y in str6:
if not('0' <= y <= '9'):
print('字符串不是纯数字')
break
else:
print('字符串是纯数字')
5.in 和 not in
字符串1 in 字符串2 - 判断字符串1收否是字符串2的子串
print('abc' in 'acbnm') # False
print('abc' in 'abcnm') # True
print('a' in 'abc') # True
6.相关函数
max/min/sorted/reversed等,这些函数都适用于字符串
len(字符串) - 求字符串的长度
str(数据) - 将自定数据转换成字符串
a.所有的数据都可以转换成字符串
b.将数据的打印值作为字符串的内容
str7 = r'\tabc'
print(len(str7)) # 5
num = 100
print([str(num)]) # ['100']
四、字符串相关方法
1.center/rjust/ljust/zfill
字符串.center(长度,填充字符) - 产生一个新的字符串:长度是指定长度,原字符串在新字符串中间,左右用指定字符填充
字符串.ljust(长度,填充字符) - 产生一个新的字符串:长度是指定长度,原字符串在新字符串左边,右边用指定字符填充
字符串.rjust(长度,填充字符) - 产生一个新的字符串:长度是指定长度,原字符串在新字符串右边,左边用指定字符填充
字符串.zfill(长度) == 字符串.rjust(长度,‘0’)
str1 = 'abc'
new_str1 = str1.center(7, 'x')
print(new_str1) # xxabcxx
new_str2 = str1.ljust(7, '#')
print(new_str2) # abc####
new_str3 = str1.rjust(7, '*')
print(new_str3) # ****abc
练习:给任意一个商品的数字编号值,转换成固定格式的商品编码:GDXXXX -> GD0001, GD0002,…
num = 34
new_str = 'GD' + str(num).zfill(4)
print(new_str)
2.replace
字符串1.replace(字符串2, 字符串3) - 将字符串1中所有的字符串2全部替换成字符3
字符串1.replace(字符串2, 字符串3,N) - 将字符串1中的前N个字符串2替换成字符3
str1 = 'how are you? i am fine, thank you!'
new_str4 = str1.replace('o', '*')
print(new_str4) # 'h*w are y*u? i am fine, thank y*u!'
new_str5 = str1.replace('o', '$', 2)
print(new_str5) # 'h$w are y$u? i am fine, thank you!'