在学C语言时,我们已经非常了解字符串的使用。字符串中用到的一些函数可以非常方便的解决问题。
字符串的表示
>>> print(repr("hello,world"))
'hello,world'
>>> print(str("hello,world"))
hello,world
长字符串、原始字符串、Unicode
>>> path='C:\nowhere'
>>> path
'C:\nowhere'
>>> print (path)
C:
owhere
>>> path='C:\\nowhere'
>>> path
'C:\\nowhere'
>>> print (path)
C:\nowhere
>>> print('C:\nowhere')
C:
owhere
>>> print(r'C:\nowhere')
C:\nowhere
>>> print(r'C:\Program Files\a\b\c\d\e\d')
C:\Program Files\a\b\c\d\e\d
>>> print(r'C:\nowhere\')
File "<stdin>", line 1
print(r'C:\nowhere\')
^
SyntaxError: EOL while scanning string literal
>>> print(r'C:\nowhere''\\')
C:\nowhere\
在python3中,所有的字符串都是Unicode字符串。
字符串格式化
>>> format="hello,%s,%s enough for ya?"
>>> values=('world','Hot')
>>> print (format%values)
hello,world,Hot enough for ya?
注意:(1)只有元组和字典可以格式化一个以上的值。
格式化转换类型
字段宽度和精度
>>> from math import pi
>>> '%10f'%pi # 字段宽 10
' 3.141593'
>>> '%10.2f'%pi #字段宽 10 ,精度 2
' 3.14'
>>> '%.2f'%pi #精度 2
'3.14'
>>> '%.5s'%'guido van ross'
'guido'
若使用*作为宽度或者精度,那么数值从元组参数中读出,如下:
>>> '%.*s'%(5,'guido van ross')
'guido'
符号、对齐、用0填充
>>> '%010.2f'%pi
'0000003.14'
这边需注意下:010开头的0并不是表示字段宽度说明符是八进制的,它只是个普通的python数值。010说明的是宽度为10,前面空格处用0填充。
>>> '%-10.2f'%pi
'3.14 '
(3)空格意味着在正数数前加上空格,这对于对齐正负数会很有用。
>>> print(('% 5d' % 10)+'\n'+('% 5d' % -10))
10
-10
(4)加号(+),不管是正数还是负数都标记符号,同样在对齐时很有用。
字符串方法
字符串的方法非常丰富,因为字符串从string模块中继承了很多方法。
序号 | 方法及描述 |
---|---|
1 | capitalize() |
2 | 返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。 |
3 | count(str, beg= 0,end=len(string)) 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
4 | bytes.decode(encoding="utf-8", errors="strict") Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回。 |
5 | encode(encoding='UTF-8',errors='strict') 以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace' |
6 | endswith(suffix, beg=0, end=len(string)) |
7 | 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。 |
8 | find(str, beg=0 end=len(string)) 检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1 |
9 | index(str, beg=0, end=len(string)) 跟find()方法一样,只不过如果str不在字符串中会报一个异常. |
10 | 如果字符串至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False |
11 | 如果字符串至少有一个字符并且所有字符都是字母则返回 True,否则返回 False |
12 | 如果字符串只包含数字则返回 True 否则返回 False.. |
13 | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
14 | 如果字符串中只包含数字字符,则返回 True,否则返回 False |
15 | 如果字符串中只包含空白,则返回 True,否则返回 False. |
16 | 如果字符串是标题化的(见 title())则返回 True,否则返回 False |
17 | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
18 | 以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
19 | 返回字符串长度 |
20 | 返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格。 |
21 | 转换字符串中所有大写字符为小写. |
22 | 截掉字符串左边的空格或指定字符。 |
23 | 创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
24 | 返回字符串 str 中最大的字母。 |
25 | 返回字符串 str 中最小的字母。 |
26 | 把 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。 |
27 | rfind(str, beg=0,end=len(string)) 类似于 find()函数,不过是从右边开始查找. |
28 | rindex( str, beg=0, end=len(string)) 类似于 index(),不过是从右边开始. |
29 | 返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串 |
30 | 删除字符串字符串末尾的空格. |
31 | split(str="", num=string.count(str)) num=string.count(str))以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num 个子字符串 |
32 | 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。 |
33 | startswith(str, beg=0,end=len(string)) 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。 |
34 | 在字符串上执行 lstrip()和 rstrip() |
35 | 将字符串中大写转换为小写,小写转换为大写 |
36 | 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
37 | translate(table, deletechars="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 deletechars 参数中 |
38 | 转换字符串中的小写字母为大写 |
39 | 返回长度为 width 的字符串,原字符串右对齐,前面填充0 |
40 | 检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。 |