字符串
python 不支持单字符类型,单字符也作为字符串。
用单引号 ’ 或双引号 " 创建字符串:
str_1 = 'Hello!'
str_2 = "World!"
print(str_1,str_2)
Hello! World!
访问字符串中的值
截取语法格式如下:
str[0:10:2]
变量[头下标:尾下标:步长]
索引值以0开始,-1为末尾位置:
从后面的索引: -6 -5 -4 -3 -2 -1
从前面的索引: 0 1 2 3 4 5
+---+---+---+---+---+---+
| a | b | c | d | e | f |
+---+---+---+---+---+---+
str = "Hello!World!"
print(str) # 输出字符串
print(str[0]) # 输出第一个字符
print(str[-1]) # 输出最后一个字符
print(str[0:-1]) # 输出第一个到倒数第二个字符串
print(str[:-1]) # 同上
print(str[1:]) # 输出第二个字符后面所有字符
print(str[:-1:2]) # 输出第一个到倒数第二个字符串,步长为2(每隔一个字符取一次)
print(str[::-1]) # 逆序输出
print(str * 2) # 输出两次
print(str + "!!!!") # 连接字符串
Hello!World!
H
!
Hello!World
Hello!World
ello!World!
HloWrd
!dlroW!olleH
Hello!World!Hello!World!
Hello!World!!!!!
注意:字符串截取的时候str[头下标:尾下标],是一个左闭右开区间[头下标,尾下标),即包含左不包含右。
与C 字符串不同的是,python 的字符串不能被改变。比如向一个索引位置赋值:str[3] = ‘a’,会导致错误。
转义字符
转义字符 | 描述 |
---|---|
\(在行尾时) | 续行符 |
\\ | 反斜杠符号 |
\’ | 单引号 |
\" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,yy 代表的字符,例如:\o12 代表换行,其中 o 是字母,不是数字 0。 |
\xyy | 十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
字符串运算符
操作符 | 描述 |
---|---|
+ | 字符串连接 a + b |
* | 重复输出字符串 |
[] | 通过索引获取字符串中字符 |
[ : ] | 截取字符串中的一部分,遵循左闭右开原则,str[0:2] 是不包含第 3 个字符的。 |
in | 成员运算符,如果字符串中包含给定的字符返回 True |
not in | 成员运算符,如果字符串中不包含给定的字符返回 True |
r/R | 原始字符串,原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母 r(可以大小写)以外,与普通字符串有着几乎完全相同的语法。 |
% | 格式字符串 |
str_1 = "Hello"
str_2 = "World"
print(str_1 + str_2)
print(str_1 * 3)
print(str_1[0])
print(str_1[0:3])
print('H' in str_1)
print('H' not in str_1)
print()
print('Hello\nWorld')
print()
print(r'Hello\nWorld')
print(R'Hello\nWorld')
HelloWorld
HelloHelloHello
H
Hel
True
False
Hello
World
Hello\nWorld
Hello\nWorld
字符串格式化
格式化符号:
符号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %f 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
a = 'A'
b = 'Hello'
c = 2
d = 2.1234
print('这是a的值:%c' % (a))
print('这是b的值:%s' % (b))
print('这是c的值:%d' % (c))
print('这是d的值:%f' % (d))
print('这是d的值保留两位小数:%.2f' % (d))
这是a的值:A
这是b的值:Hello
这是c的值:2
这是d的值:2.123400
这是d的值:2.12
格式化操作符辅助指令:
符号 | 功能 |
---|---|
* | 定义宽度或者小数点精度 |
- | 用做左对齐 |
+ | 在正数前面显示加号( + ) |
<sp> | 在正数前面显示空格 |
# | 在八进制数前面显示零(‘0’),在十六进制前面显示’0x’或者’0X’(取决于用的是’x’还是’X’) |
0 | 显示的数字前面填充’0’而不是默认的空格 |
% | ‘%%‘输出一个单一的’%’ |
(var) | 映射变量(字典参数) |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
三引号
三引号不仅可以作为注视,还可以让程序员从引号和特殊字符串的泥潭里面解脱出来,自始至终保持一小块字符串的格式是所谓的WYSIWYG(所见即所得)格式的。
一个典型的用例是,当你需要一块HTML或者SQL时,这时用字符串组合,特殊字符串转义将会非常的繁琐。
HTML = '''
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H3>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
'''
SQL = '''
CREATE TABLE users (
login VARCHAR(8),
uid INTEGER,
prid INTEGER)
'''
print(HTML)
print(SQL)
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H3>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
CREATE TABLE users (
login VARCHAR(8),
uid INTEGER,
prid INTEGER)
f-string
f-string 是 python3.6 之后版本添加的,称之为字面量格式化字符串,是新的格式化字符串的语法。
之前我们习惯用百分号 (%):
name = 'Bob'
print('His name is %s' % (name))
His name is Bob
f-string 格式化字符串以 f 开头,后面跟着字符串,字符串中的表达式用大括号 {} 包起来,它会将变量或表达式计算后的值替换进去:
name = 'Bob'
age = 18
print('His name is ' + f'{name}'
+ ' He is ' + f'{age}')
His name is Bob He is 18
Unicode 字符串
在Python2中,普通字符串是以8位ASCII码进行存储的,而Unicode字符串则存储为16位unicode字符串,这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀 u。
在Python3中,所有的字符串都是Unicode字符串。
字符串内建函数
序号 | 方法及描述 |
---|---|
1 | capitalize():将字符串的第一个字符转换为大写 |
2 | center(width, fillchar):返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。 |
3 | count(str, beg= 0,end=len(string)):返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
4 | bytes.decode(encoding=“utf-8”, errors=“strict”):Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回。 |
5 | encode(encoding=‘UTF-8’,errors=‘strict’):以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是’ignore’或者’replace’ |
6 | endswith(suffix, beg=0, end=len(string)):检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
7 | expandtabs(tabsize=8):把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。 |
8 | find(str, beg=0, end=len(string)):检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1 |
9 | index(str, beg=0, end=len(string)):跟find()方法一样,只不过如果str不在字符串中会报一个异常。 |
10 | isalnum():如果字符串至少有一个字符并且所有字符都是字母或数字则返 回 True,否则返回 False |
11 | isalpha():如果字符串至少有一个字符并且所有字符都是字母或中文字则返回 True, 否则返回 False |
12 | isdigit():如果字符串只包含数字则返回 True 否则返回 False… |
13 | islower():如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
14 | isnumeric():如果字符串中只包含数字字符,则返回 True,否则返回 False |
15 | isspace():如果字符串中只包含空白,则返回 True,否则返回 False. |
16 | istitle():如果字符串是标题化的(见 title())则返回 True,否则返回 False |
17 | isupper():如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
18 | join(seq):以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
19 | len(string):返回字符串长度 |
20 | ljust(width[, fillchar]):返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格。 |
21 | lower():转换字符串中所有大写字符为小写. |
22 | lstrip():截掉字符串左边的空格或指定字符。 |
23 | maketrans():创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
24 | max(str):返回字符串 str 中最大的字母。 |
25 | min(str):返回字符串 str 中最小的字母。 |
26 | replace(old, new [, max]):把 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。 |
27 | rfind(str, beg=0,end=len(string)):类似于 find()函数,不过是从右边开始查找. |
28 | rindex( str, beg=0, end=len(string)):类似于 index(),不过是从右边开始. |
29 | rjust(width,[, fillchar]):返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串 |
30 | rstrip():删除字符串字符串末尾的空格. |
31 | split(str="", num=string.count(str)):以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num+1 个子字符串 |
32 | splitlines([keepends]):按照行(’\r’, ‘\r\n’, \n’)分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。 |
33 | startswith(substr, beg=0,end=len(string)):检查字符串是否是以指定子字符串 substr 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。 |
34 | strip([chars]):在字符串上执行 lstrip()和 rstrip() |
35 | swapcase():将字符串中大写转换为小写,小写转换为大写 |
36 | title():返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
37 | translate(table, deletechars=""):根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中 |
38 | upper():转换字符串中的小写字母为大写 |
39 | zfill (width):返回长度为 width 的字符串,原字符串右对齐,前面填充0 |
40 | isdecimal():检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。 |
string = 'hello,world!'
seq = ['Bob', 'jack', 'john']
print('1:', string.capitalize())
# 将字符串的第一个字符转换为大写
print('2:', string.center(50, '-'))
# 返回一个指定的宽度 width 居中的字符串,填充的字符默认为空格。
print('3:', string.rjust(50, '-'))
# 返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串
print('4:', string.count('l'))
# 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数
print('5:', string.find('w'))
# 检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1
print('6:', string.rfind('l'))
# 类似于 find()函数,不过是从右边开始查找.
print('7:', string.index('w'))
# 跟find()方法一样,只不过如果str不在字符串中会报一个异常。
print('8:', string.rindex('w'))
# 类似于 index(),不过是从右边开始.
print('9:', string.isalnum())
# 如果字符串至少有一个字符并且所有字符都是字母或数字则返 回 True,否则返回 False
print('10:', string.isalpha())
# 如果字符串至少有一个字符并且所有字符都是字母或中文字则返回 True, 否则返回 False
print('11:', string.isdigit())
# 如果字符串只包含数字则返回 True 否则返回 False
print('12:', string.islower())
# 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False
print('13:', string.isupper())
# 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False
print('14:', string.isnumeric())
# 如果字符串中只包含数字字符,则返回 True,否则返回 False
print('15:', string.isspace())
# 如果字符串中只包含空白,则返回 True,否则返回 False
print('16:', string.istitle())
# 如果字符串是标题化的(见 title())则返回 True,否则返回 False
print('17:', '|'.join(seq))
# 以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
print('18:', len(string))
# 返回字符串长度
print('19:', string.lstrip('he'))
# 截掉字符串左边的空格或指定字符
print('20:', string.rstrip('!'))
# 删除字符串右边的空格或指定字符
print('21:', string.strip('h'))
# 在字符串上执行 lstrip()和 rstrip()
print('22:', max(string))
# 返回字符串 str 中最大的字母。
print('23:', min(string))
# 返回字符串 str 中最小的字母。
print('24:', string.replace('l', 'L', 2))
# 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。
print('25:', string.split(','))
# 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num+1 个子字符串
print('26:', string.splitlines())
# 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。
print('27:', string.startswith('h'))
# 检查字符串是否是以指定子字符串 substr 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。
print('28:', string.endswith('!'))
# 检查字符串是否是以指定子字符串 substr 结束,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。
print('29:', string.swapcase())
# 将字符串中大写转换为小写,小写转换为大写
print('30:', string.title())
# 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle())
print('31:', string.zfill(50))
# 返回长度为 width 的字符串,原字符串右对齐,前面填充0
print('32:', string.isdecimal())
# 检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。
1: Hello,world!
2: -------------------hello,world!-------------------
3: --------------------------------------hello,world!
4: 3
5: 6
6: 9
7: 6
8: 6
9: False
10: False
11: False
12: True
13: False
14: False
15: False
16: False
17: Bob|jack|john
18: 12
19: llo,world!
20: hello,world
21: ello,world!
22: w
23: !
24: heLLo,world!
25: ['hello', 'world!']
26: ['hello,world!']
27: True
28: True
29: HELLO,WORLD!
30: Hello,World!
31: 00000000000000000000000000000000000000hello,world!
32: False