Python-字符串总结（创建、操作符、方法、相关内置函数、相关模块）

[index]返回字符，也称为索引，部分教程与切片分开
[start:stop]返回从start开始，到stop-1的字符串，不包含stop，start默认为0，stop默认为最后一个index+1。
[start:stop:step]返回从start开始，到stop-1的字符串,每step个取一个字符。step>0时，start默认为0,stop默认为最后一个index+1。step<0时，start默认为-1,stop默认为第一个index-1。start,stop>0时，step默认为1。start,stop<0时，step默认为-1。

注意：

index超出范围时引发IndexError。start与stop一样或start在stop右边，返回空列表。step为0时引发ValueError。
在Pycharm中import builtins，选中builtins,按Ctrl+B，打开builtins.pyi，找到class slice，查看更多详细内容。


>=0时的index	0	1	2	3	4	5	6	7	8	9	10
字符串	H	e	l	l	o		W	o	r	l	d
<0时的index	-11	-10	-9	-8	-7	-6	-5	-4	-3	-2	-1

s[2]
‘l’
s[-4]
‘o’

>>> s[2:5]
‘llo’

s[1:]
‘ello World’
s[:7]
‘Hello W’
s[-2:]
‘ld’
s[:-3]
‘Hello Wo’

s[1:6:]
'ello ’
s[-8:-2:]
‘lo Wor’
s[:8:]
‘Hello Wo’
s[1::]
‘ello World’
s[::-1]
‘dlroW olleH’

小技巧：[::-1]常用来得到反转的字符串，原字符串不变

判断子串（成员操作符in,not in）

s = “Hello World”
“Hello” in s
True
“hello” not in s
True
“world” in s
False

拼接（连接符+）

“Hello”+“World”
‘HelloWorld’

重复（重复操作符*）

‘-’*10
‘----------’

操作符r在特殊字符后

比较（==、!=、>、<、>=、<=）

python中不像c++，有compare函数，直接使用比较运算符比较字符串即可。

“hello”==“hi”
False
“hello”!=“hi”
True
“hello”>“hi”
False
“hello”<“hi”
True
“hello”>=“hi”
False
“hello”<=“hi”
True

删除

使用关键字del，删除后不可再用，否则NameError。没必要显式删除，Python会自动处理的。

del s
s
Traceback (most recent call last):
File “”, line 1, in
NameError: name ‘s’ is not defined

格式化

%

格式化符号

符号	描述
%c	格式化字符及其ASCII码
%s	格式化字符串
%d	格式化整数
%u	格式化无符号整型
%o	格式化无符号八进制数
%x	格式化无符号十六进制数
%X	格式化无符号十六进制数（大写）
%f	格式化浮点数字，可指定小数点后的精度
%e	用科学计数法格式化浮点数
%E	作用同%e，用科学计数法格式化浮点数
%g	%f和%e的简写
%G	%F 和 %E 的简写
%p	用十六进制数格式化变量的地址

辅助符号

符号	功能
*	定义宽度或者小数点精度
-	用做左对齐
+	在正数前面显示加号( + )
	在正数前面显示空格
#	在八进制数前面显示零(‘0’)，在十六进制前面显示’0x’或者’0X’(取决于用的是’x’还是’X’)
0	显示的数字前面填充’0’而不是默认的空格
%	‘%%‘输出一个单一的’%’
(var)	映射变量(字典参数)
m.n.	m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话)

‘grade:%f’ % 12.345678
‘grade:12.345678’

‘grade:%.2f’ % 92.2354
‘grade:92.24’

‘grade:%c’ % 66
‘grade:B’

‘grade:%s’ % ‘good’
‘grade:good’

f"{}"

python版本>=3.6

比上面的，以及.format()效率要高。如果你的python版本高一点，建议使用这个。

同样，格式化符号有很多，博主不再黏贴，针对数字，字符串，时间之类的都有，黏贴的话文章太长。

例如，datetime的格式化符号。

举例

代码：

from datetime import datetime
now = datetime.now()
print(f’datetime_now:{now:%F %X}')

terminal:

datetime_now:2020-09-05 09:39:15

pycharm里面敲的，不是交互式。

转义字符

转义字符	描述
(在行尾时)	续行符
\	反斜杠符号
’	单引号
"	双引号
\a	响铃
\b	退格(Backspace)
\e	转义
\000	空
\n	换行
\v	纵向制表符
\t	横向制表符
\r	回车
\f	换页
\oyy	八进制数，yy代表的字符，例如：\o12代表换行
\xyy	十六进制数，yy代表的字符，例如：\x0a代表换行
\other	其它的字符以普通格式输出

代码:

print(‘hello\nworld’)

terminal:

hello
world

原始字符串（操作符r）

这个没有放到前面的操作符中，因为在转义字符后面讲比较好。r可以使字符串里面就是字符串内容本身，没有转义等。

代码：

print(r’hello\nworld’)

terminal:

hello\nworld

在pycharm中不加r时，字符串中的\n是橘色的，加了后就是绿色了。

方法

s = ‘hello world’
type(s)
<class ‘str’>

一个字符串是类str的一个对象，也就可以调用str类的方法。

拆分

split(sep=None, maxsplit=-1)

返回一个由字符串内单词组成的列表，使用 sep 作为分隔字符串。如果给出了 maxsplit，则最多进行 maxsplit 次拆分（因此，列表最多会有 maxsplit+1 个元素）。如果 maxsplit 未指定或为 -1，则不限制拆分次数（进行所有可能的拆分）。

如果给出了 sep，则连续的分隔符不会被组合在一起而是被视为分隔空字符串 (例如 '1,,2'.split(',') 将返回 ['1', '', '2'])。 sep 参数可能由多个字符组成 (例如 '1<>2<>3'.split('<>') 将返回 ['1', '2', '3'])。使用指定的分隔符拆分空字符串将返回 ['']。

sep没给的话是默认是空格，几个空格都可以。

“hello world,i’m lady_killer”.split(‘,’)
[‘hello world’, “i’m lady_killer”]
“hello wor ld,i’m lady_killer”.split()
[‘hello’, ‘wor’, “ld,i’m”, ‘lady_killer’]

rsplit方法参数相同，不同的是从右边开始

拼接

join(iterable)

返回一个由 iterable （可迭代的对象）中的字符串拼接而成的字符串。如果 iterable 中存在任何非字符串值包括bytes对象则会引发TypeError。调用该方法的字符串将作为元素之间的分隔。

‘:’.join(“2020 09 05 13 54”.split())
‘2020:09:05:13:54’

替换

replace(old, new[, count])

返回字符串的副本，其中出现的所有子字符串 old 都将被替换为 new。如果给出了可选参数 count，则只替换前 count 次出现。

>>> “”.join(“hello world,i’m lady killer”[::-1]).replace(‘dlrow’,‘world’)
“rellik ydal m’i,world olleh”

移除前导、末尾字符

strip([chars])

返回原字符串的副本，移除其中的前导和末尾字符。 chars 参数为指定要移除字符的字符串。如果省略或为 None，则 chars 参数默认移除空格符。实际上 chars 参数并非指定单个前缀或后缀；而是会移除参数值的所有组合。

" hello world ".strip()
‘hello world’
"12.45 ".strip()
‘12.45’
“2323345623323”.strip(‘32’)
‘456’

32可以组合成2、3、23、32等。你可以理解为前后遍历含chars中任一字符便删除，无法删除时停止。

统计子串

count(sub[, start[, end]])

返回子字符串 sub 在 [start, end] 范围内非重叠出现的次数，默认是整个字符串。可选参数 start 与 end， 会被解读为切片表示法。

‘www.example.com’.count(‘com’)
1

‘www.example.com’.count(‘w’,1,7)
2

寻找子串索引

find(sub[, start[, end]])

返回子字符串 sub 在 s[start:end] 切片内被找到的最小索引。可选参数 start 与 end 会被解读为切片表示法。如果 sub 未被找到则返回 -1。

‘www.example.com’.find(‘w’,1,7)
1
‘www.example.com’.find(‘w’,3,7)
-1

rfind方法，参数相同，返回找到的最大的索引

index与rindex在未找到时会引发ValueError，不建议使用。

转换大小写

转为小写

lower()

返回原字符串的副本，其所有区分大小写的字符均转换为小写。

‘WWW.example.com’.lower()
‘www.example.com’

转为大写

upper()

返回原字符串的副本，其中所有区分大小写的字符均转换为大写。请注意如果 s 包含不区分大小写的字符或者如果结果字符的 Unicode 类别不是 “Lu” (Letter, uppercase) 而是 “Lt” (Letter, titlecase) 则 s.upper().isupper() 有可能为 False。

>>> ‘www.example.com’.upper()
‘WWW.EXAMPLE.COM’

判断字符串类型

全是字母

isalpha()

如果字符串中的所有字符都是字母，并且至少有一个字符，返回 True ，否则返回 False 。字母字符是指那些在 Unicode 字符数据库中定义为 “Letter” 的字符，即那些具有 “Lm”、“Lt”、“Lu”、“Ll” 或 “Lo” 之一的通用类别属性的字符。注意，这与 Unicode 标准中定义的"字母"属性不同。

‘www.example.com’.isalpha()
False
‘wwwexamplecom’.isalpha()
True

全是数字

isdecimal()

如果字符串中的所有字符都是十进制字符且该字符串至少有一个字符，则返回 True ，否则返回 False 。十进制字符指那些可以用来组成10进制数字的字符，例如 U+0660 ，即阿拉伯字母数字0 。严格地讲，十进制字符是 Unicode 通用类别 “Nd” 中的一个字符。

‘1’.isdecimal()
True

‘IV’.isdecimal()
False

‘六六六’.isdecimal()
False

isdigit()

如果字符串中的所有字符都是数字，并且至少有一个字符，返回 True ，否则返回 False 。数字包括十进制字符和需要特殊处理的数字，如兼容性上标数字。这包括了不能用来组成十进制数的数字，如 Kharosthi 数。严格地讲，数字是指属性值为 Numeric_Type=Digit 或 Numeric_Type=Decimal 的字符。

‘IV’.isdigit()
False
‘六六六’.isdigit()
False

isnumeric()

如果字符串中至少有一个字符且所有字符均为数值字符则返回 True ，否则返回 False 。数值字符包括数字字符，以及所有在 Unicode 中设置了数值特性属性的字符，例如 U+2155, VULGAR FRACTION ONE FIFTH。正式的定义为：数值字符就是具有特征属性值 Numeric_Type=Digit, Numeric_Type=Decimal 或 Numeric_Type=Numeric 的字符。