一. 转义字符整理
二. 字符串的截取和连接
1. 字符串的切片:
str1 = 'itmanisme'
# 正向索引:0,1,2,3,4,5,6,7,8
# 负向索引:-9,-8,-7,-6,-5,-4,-3,-2,-1
print(len(str1))
# 内置函数len()获取字符串长度——9
print(str1[2])
# 打印输出字符串中索引为2的元素——m
print(str1[2:5])
# 打印输出字符串中索引2到索引4的元素——m a n
# 为什么没有打印出索引5的元素?因为截取片段的右区间是开区间。
print(str1[2,-1])
# 打印输出索引2到索引-1(负向索引)之间的元素——m a n i s m
print(f'{str1}[0:7:2]:',str1[0:7:2])
# 0为初始位置,7为结束位置,2为步长
print(f'{str1}[0:7:2]',str1[0:7:-2])
# 0为初始位置,7为结束位置,2为步长,负数步长表示反向打印
str2 = '这是什么?' \
'地球' \
'人类' \
print(str2)
# 输出结果为——这是什么?地球人类
# 使用斜线多行编写字符串,最终归可归为一行输出。
2.字符串的函数
capitalize()——首字母大写化
title()——每个单词的首字母大写化
istitile()——判断每个单词的首字母是否大写
upper()——全部字母变大写
lower()——全部字母变小写
count()——某一个特定的字符出现过几次
find(字符串,开始位置,结束位置)——查找某一个字符串第一次出现的位置,没有的话返回-1
index()——与find()功能一致,只不过找不到会直接报错
startswith(字符串,开头位置,结束位置)——判断是否以某个字符或者字符串开头
endwith(字符串,开头位置,结束位置)——判断是否以某个字符或者字符串结尾
split(分割依据,分割几次)——将字符串,在指定的元素处进行分割,从左向右
rsplit(分割依据,分割几次)——从右往左,分割返回的是一个列表
listvar()——按照字符将列表拼接成字符串(容器类型都可),返回字符串
replace(被替,替换物,替换次数)——替换函数
strip()——去掉首位两边的空白符
lstrip()——左去掉
rstrip()——右去掉
isspace()——判断字符串中是否只包含空白符,是的话返回True,否返回False
# 所谓空白符,包括空格,也包括\t,\n,\r等
isalpha()——判断字符串中是否至少有一个字符,同时皆为字母,是True,否False
isalnum()——判断字符串是否至少有一个字符,同时不是字母就是数字,True,False
isdecimal(),isdigit(),isnumeric()——判断是否全是数字
# 判断全角数字:True,True,True
# 判断罗马数字:False,False,True
# 判断汉字数字:True,True,False
# 判断字节数字(num=b'1'):报错,True,报错
len()——计算字符串长度
center(填充的个数,用什么填充)——字符串在中间,其余位置填充
重点:编码和解码(爬虫和网页制作经常使用)
max —— 返回字符串中编码最大的字母
min —— 返回字符串中编码最小的字母
引入概念:字符集——UTF-,ASCII,GBK,Unicode等
ord()——内置函数,返回汉字或者数字的Unicode编码
注:Python3 默认是Unicode,16位编码
encode()——用什么编码模式对字符串进行编码
# str1.encode(UTF-8)
# 举例:我打开一个文件的时候出现乱码,有可能是文本的编码模式和解析模式不一致造成解释结果不同,形成乱码。
decode()——用什么编码模式对字符串进行解码
举例: