python3：使用字符串

最新推荐文章于 2023-01-13 23:09:21 发布

sunshine_lyn

最新推荐文章于 2023-01-13 23:09:21 发布

阅读量430

点赞数

分类专栏： Python学习

本文链接：https://blog.csdn.net/sunshine_lyn/article/details/81063572

版权

Python学习专栏收录该内容

34 篇文章 1 订阅

订阅专栏

在学C语言时，我们已经非常了解字符串的使用。字符串中用到的一些函数可以非常方便的解决问题。

在python中，字符串又有哪些用处呢？下面做一个详细的介绍。

字符串的表示

将值转化为字符串的两种机制：

str函数：把值转换为合理形式的字符串，以便用户理解。

repr函数:它创建一个字符串，以合法的python表达式的形式来表示。

>>> print(repr("hello,world"))
'hello,world'
>>> print(str("hello,world"))
hello,world

长字符串、原始字符串、Unicode

（1）长字符串

对于那些过长的字符串，为了便于阅读，可以在结尾加上\，来连接多行输入。

（2）原始字符串

由于在普通的字符串中，反斜线有特殊的作用，会转义。

>>> path='C:\nowhere'
>>> path
'C:\nowhere'

这似乎看起来是合适的，但是print的时候就会出问题。如下：

>>> print (path)
C:
owhere

那么怎么办呢？可用反斜线对其本身进行转义。

>>> path='C:\\nowhere'
>>> path
'C:\\nowhere'
>>> print (path)
C:\nowhere

那么对于长路径来说，这样的操作十分不便。这时候就需要使用原始字符串了。确保在原始字符串中输入的每个字符串都会与书写方式保持一致。

>>> print('C:\nowhere')
C:
owhere
>>> print(r'C:\nowhere')
C:\nowhere
>>> print(r'C:\Program Files\a\b\c\d\e\d')
C:\Program Files\a\b\c\d\e\d

注意：不能在原始字符串结尾加上\，如果最后一个字符（位于结束引号前的那个字符）是反斜线，python就不清楚是否应该结束字符串。

解决办法：将\作为单独的一个字符串来处理。如下：

>>> print(r'C:\nowhere\')
  File "<stdin>", line 1
    print(r'C:\nowhere\')
                        ^
SyntaxError: EOL while scanning string literal
>>> print(r'C:\nowhere''\\')
C:\nowhere\

（3）Unicode

python中的普通字符串存储的是8位ASCLL码，而Unicode字符串存储的是16位Unicode字符。

在python3中，所有的字符串都是Unicode字符串。

字符串格式化

使用字符串格式化操作符即%来实现。当然%也可作为取模运算的操作符。

在%左侧放置一个字符串（格式化字符串），右侧放希望被格式化的值。当然，这个值可以是一个字符串或者数字，也可以是使用多个值的元组或者字典（需要格式化多个值）。

一般情况下使用元组，其中元组中的每一个元素都会被单独格式化，每一个值都需要一个对应的转换说明符，如下所示:

>>> format="hello,%s,%s enough for ya?"
>>> values=('world','Hot')
>>> print (format%values)
hello,world,Hot enough for ya?

注意：（1）只有元组和字典可以格式化一个以上的值。

（2）格式化字符串中的%s称为转义说明符（conversion specifier），标记需要插入转换值的位置。且s表明值会被转化为字符串。

（3）在格式化字符串中有%需写成%%，避免误认为是转换说明符。

格式化转换类型

字段宽度和精度

转换说明符可以包括字段宽度和精度。其中，

字段宽度是转换后的值所保留的最小字符个数。

精度是结果中应该包含的小数位数，或是转换后的值所保留的最大字符个数。

这两个参数同时出现时，先是字段宽度，再是精度。中间用点（.)分隔。如下：

>>> from math import pi
>>> '%10f'%pi    # 字段宽 10
'  3.141593'
>>> '%10.2f'%pi  #字段宽 10 ，精度 2
'      3.14'
>>> '%.2f'%pi   #精度 2
'3.14'
>>> '%.5s'%'guido van ross'
'guido'

若使用*作为宽度或者精度，那么数值从元组参数中读出，如下：

>>> '%.*s'%(5,'guido van ross')
'guido'

符号、对齐、用0填充

在宽度和精度之前还可以放置一个“标志”，该标志可以是0、+、-、空格。

（1）0表示数字将以0填充。如下：

>>> '%010.2f'%pi
'0000003.14'

这边需注意下：010开头的0并不是表示字段宽度说明符是八进制的，它只是个普通的python数值。010说明的是宽度为10，前面空格处用0填充。

（2）减号（-）用来左对齐数值。即字段宽度中出现的空格位于右侧了。如下：

>>> '%-10.2f'%pi
'3.14      '

（3）空格意味着在正数数前加上空格，这对于对齐正负数会很有用。

>>> print(('% 5d' % 10)+'\n'+('% 5d' % -10))
   10
  -10

（4）加号（+），不管是正数还是负数都标记符号，同样在对齐时很有用。

字符串方法

字符串的方法非常丰富，因为字符串从string模块中继承了很多方法。

序号	方法及描述
1	capitalize() 将字符串的第一个字符转换为大写
2	center(width, fillchar) 返回一个指定的宽度 width 居中的字符串，fillchar 为填充的字符，默认为空格。
3	count(str, beg= 0,end=len(string)) 返回 str 在 string 里面出现的次数，如果 beg 或者 end 指定则返回指定范围内 str 出现的次数
4	bytes.decode(encoding="utf-8", errors="strict") Python3 中没有 decode 方法，但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象，这个 bytes 对象可以由 str.encode() 来编码返回。
5	encode(encoding='UTF-8',errors='strict') 以 encoding 指定的编码格式编码字符串，如果出错默认报一个ValueError 的异常，除非 errors 指定的是'ignore'或者'replace'
6	endswith(suffix, beg=0, end=len(string)) 检查字符串是否以 obj 结束，如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束，如果是，返回 True,否则返回 False.
7	expandtabs(tabsize=8) 把字符串 string 中的 tab 符号转为空格，tab 符号默认的空格数是 8 。
8	find(str, beg=0 end=len(string)) 检测 str 是否包含在字符串中，如果指定范围 beg 和 end ，则检查是否包含在指定范围内，如果包含返回开始的索引值，否则返回-1
9	index(str, beg=0, end=len(string)) 跟find()方法一样，只不过如果str不在字符串中会报一个异常.
10	isalnum() 如果字符串至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False
11	isalpha() 如果字符串至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
12	isdigit() 如果字符串只包含数字则返回 True 否则返回 False..
13	islower() 如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回 True，否则返回 False
14	isnumeric() 如果字符串中只包含数字字符，则返回 True，否则返回 False
15	isspace() 如果字符串中只包含空白，则返回 True，否则返回 False.
16	istitle() 如果字符串是标题化的(见 title())则返回 True，否则返回 False
17	isupper() 如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False
18	join(seq) 以指定字符串作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
19	len(string) 返回字符串长度
20	ljust(width[, fillchar]) 返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串，fillchar 默认为空格。
21	lower() 转换字符串中所有大写字符为小写.
22	lstrip() 截掉字符串左边的空格或指定字符。
23	maketrans() 创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。
24	max(str) 返回字符串 str 中最大的字母。
25	min(str) 返回字符串 str 中最小的字母。
26	replace(old, new [, max]) 把将字符串中的 str1 替换成 str2,如果 max 指定，则替换不超过 max 次。
27	rfind(str, beg=0,end=len(string)) 类似于 find()函数，不过是从右边开始查找.
28	rindex( str, beg=0, end=len(string)) 类似于 index()，不过是从右边开始.
29	rjust(width,[, fillchar]) 返回一个原字符串右对齐,并使用fillchar(默认空格）填充至长度 width 的新字符串
30	rstrip() 删除字符串字符串末尾的空格.
31	split(str="", num=string.count(str)) num=string.count(str))以 str 为分隔符截取字符串，如果 num 有指定值，则仅截取 num 个子字符串
32	splitlines([keepends]) 按照行('\r', '\r\n', \n')分隔，返回一个包含各行作为元素的列表，如果参数 keepends 为 False，不包含换行符，如果为 True，则保留换行符。
33	startswith(str, beg=0,end=len(string)) 检查字符串是否是以 obj 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查。
34	strip([chars]) 在字符串上执行 lstrip()和 rstrip()
35	swapcase() 将字符串中大写转换为小写，小写转换为大写
36	title() 返回"标题化"的字符串,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())
37	translate(table, deletechars="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 deletechars 参数中
38	upper() 转换字符串中的小写字母为大写
39	zfill (width) 返回长度为 width 的字符串，原字符串右对齐，前面填充0
40	isdecimal() 检查字符串是否只包含十进制字符，如果是返回 true，否则返回 false。