【Python学习笔记系列】[万字长文] 一文带你彻底搞懂字符串常用方法

写在前面

最近这段时间比较充裕,想要系统学习一下python,这个系列算是对自己学习的一个记录吧。同时也想提供一个比较完整详细的python教程供有需要的小伙伴进行学习,大家一起共同进步!!!努力冲冲冲!!!

虽然我也不知道自己能够坚持多久,但我尽量坚持不断更哈哈哈。如果这篇文章对你有帮助的话,请多多点赞支持呀。你们的鼓励支持就是我坚持的最大动力【比心】。

如果需要查看往期文章的话,可以点击下面的文章链接,全部都已经汇总好了
【Python学习笔记系列】Python学习笔记系列文章汇总


目录

前言

dir()

help()

字符串拼接

字符串直接拼接

字符串和数字的拼接

截取字符串

获取单个字符

获取多个字符(字符串截去/字符串切片)

len()

split()

join()

count()

find()

index()

ljust()

rjust()

center()

startswith()

endswith()

title()

lower()

upper()

strip()

lstrip()

rstrip()

format()

encode()

decode()

总结


前言

本文为python学习笔记系列文章。

本文主要介绍了python中的字符串类型常用的几个方法。

注:本文主要参考了C语言中文网中的python教程。

Python有许多字符串的方法,受篇幅限制,不能每种方法都讲,本文只介绍常用的一些方法。如遇到未知的方法,可使用dir()和help()函数自行查阅。

注意,本章所讲的字符串方法,和内置函数(如 len() )不同,它们是字符串类型(str)所特有的,因此这些字符串方法的调用方式也比较特殊。

dir()

dir() 函数用来列出某个类或者某个模块中的全部内容,包括变量、方法、函数和类等。

它的用法为:

dir(obj)

obj 表示要查看的对象。obj 可以不写,此时 dir() 会列出当前范围内的变量、方法和定义的类型。

help()

help() 函数用来查看某个函数或者模块的帮助文档。

它的用法为:

help(obj)

obj 表示要查看的对象。obj 可以不写,此时 help() 会进入帮助子程序。

【实例】使用 dir() 查看字符串类型(str)支持的所有方法:

>>> dir(str)
['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isascii', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']

在 Python 标准库中,__开头和结尾的方法都是私有的,不能在类的外部调用。

【实例】使用 help() 查看 str 类型中 lower() 函数的用法:

>>> help(str.lower)
Help on method_descriptor:

lower(self, /)
    Return a copy of the string converted to lowercase.

可以看到,lower() 函数用来将字符串中的字母转换为小写形式,并返回一个新的字符串。

注意,使用 help() 查看某个函数的用法时,函数名后边不能带括号,例如将上面的命令写作help(str.lower())就是错误的。

字符串拼接

字符串直接拼接

python中字符串拼接可以直接将两个字符串紧挨着写在一起

具体语法格式为:

strname = "str1" "str2"

strname 表示拼接以后的字符串变量名,str1 和 str2 是要拼接的字符串内容。使用这种写法,Python 会自动将两个字符串拼接在一起。

举例:

# 字符串拼接举例
str1 = "人生苦短" "我学python"
print(str1)

str2 = "Java" "Python" "C++" "PHP"
print(str2)

运行结果:

人生苦短我学python
JavaPythonC++PHP

需要注意的是,这种写法只能拼接字符串常量

如果需要使用变量,就得借助+运算符来拼接,具体格式为:

strname = str1 + str2

举例:

# 字符串拼接举例--+运算符拼接
name = "百度"
url = "http://www.baidu.com"
info = name + "的网址是:" + url
print(info)

运行结果:

百度的网址是:http://www.baidu.com

字符串和数字的拼接

Python 不允许直接拼接数字和字符串,所以我们必须先将数字转换成字符串。可以借助 str() 和 repr() 函数将数字转换为字符串,它们的使用格式为:

str(obj)
repr(obj)

obj 表示要转换的对象,它可以是数字、列表、元组、字典等多种类型的数据。

举例:

# 字符串和数字拼接举例
name = "C语言中文网"
age = 8
course = 30
info = name + "已经" + str(age) + "岁了,共发布了" + repr(course) + "套教程。"
print(info)

运行结果:

C语言中文网已经8岁了,共发布了30套教程。

str() 和 repr() 函数虽然都可以将数字转换成字符串,但它们之间是有区别的:

  • str() 用于将数据转换成适合人类阅读的字符串形式。
  • repr() 用于将数据转换成适合解释器阅读的字符串形式(Python 表达式的形式),适合在开发和调试阶段使用;如果没有等价的语法,则会发生 SyntaxError 异常。

举例:

# str() 和 repr()的区别
s = "http://www.baidu.com"
s_str = str(s)
s_repr = repr(s)

print( type(s_str) )
print (s_str)
print( type(s_repr) )
print (s_repr)

运行结果:

<class 'str'>
http://www.baidu.com
<class 'str'>
'http://www.baidu.com'

从运行结果可以看出,str() 保留了字符串最原始的样子,而 repr() 使用引号将字符串包围起来,这就是 Python 字符串的表达式形式。

在 Python 交互式编程环境中输入一个表达式(变量、加减乘除、逻辑运算等)时,Python 会自动使用 repr() 函数处理该表达式。

截取字符串

从本质上讲,字符串是由多个字符构成的,字符之间是有顺序的,这个顺序号就称为索引(index)Python 允许通过索引来操作字符串中的单个或者多个字符,比如获取指定索引处的字符,返回指定字符的索引值等。

获取单个字符

知道字符串名字以后,在方括号[ ]中使用索引即可访问对应的字符,具体的语法格式为:

strname[index]

其中,strname 表示字符串名字,index 表示索引值。

与很多编程语言不同的是,Python 允许从字符串的两端使用索引: 

  • 当以字符串的左端(字符串的开头)为起点时,索引是从 0 开始计数的;字符串的第一个字符的索引为 0,第二个字符的索引为 1,第三个字符串的索引为 2 ……
  • 当以字符串的右端(字符串的末尾)为起点时,索引是从 -1 开始计数的;字符串的倒数第一个字符的索引为 -1,倒数第二个字符的索引为 -2,倒数第三个字符的索引为 -3 ……

举例:

# 截取字符串举例
url = 'http://www.baidu.com'
#获取索引为10的字符
print(url[10])

#获取索引为 6 的字符
print(url[-6])

运行结果:

.
d

获取多个字符(字符串截去/字符串切片)

使用[ ]除了可以获取单个字符外,还可以指定一个范围来获取多个字符,也就是一个子串或者片段,具体格式为:

strname[start : end : step]

对各个部分的说明:

  • strname:要截取的字符串;
  • start:表示要截取的第一个字符所在的索引(截取时包含该字符)。如果不指定,默认为 0,也就是从字符串的开头截取;
  • end:表示要截取的最后一个字符所在的索引(截取时不包含该字符)。如果不指定,默认为字符串的长度;
  • step:指的是从 start 索引处的字符开始,每 step 个距离获取一个字符,直至 end 索引出的字符。step 默认值为 1,当省略该值时,最后一个冒号也可以省略。


举例:

# 截取字符串举例
url = 'http://www.baidu.com'
#获取索引从7处到13(不包含13)的子串
print(url[7: 13])

#获取索引从7处到-6的子串
print(url[7: -6])

#获取索引从-10到-6的子串
print(url[-10: -6])

#从索引3开始,每隔4个字符取出一个字符,直到索引15为止
print(url[3: 15: 4])

运行结果:

www.ba
www.bai
.bai
pwb

举例:

# 截取字符串举例--高级用法
url = 'http://www.baidu.com'

#获取从索引5开始,直到末尾的子串
print(url[7: ])

#获取从索引-21开始,直到末尾的子串
print(url[-18: ])

#从开头截取字符串,直到索引22为止
print(url[: 19])

#每隔3个字符取出一个字符
print(url[:: 3])

运行结果:

www.baidu.com
tp://www.baidu.com
http://www.baidu.co
hp/wauo

len()

可以使用 len 函数可以知道一个字符串有多少个字符(获得字符串长度),或者一个字符串占用多少个字节。

语法格式为:

len(string)

其中 string 用于指定要进行长度统计的字符串。

举例:

# len()函数举例
a='http://www.baidu.com'
print(len(a))

运行结果为:

20

在实际开发中,除了常常要获取字符串的长度外,有时还要获取字符串的字节数。

在 Python 中,不同的字符所占的字节数不同,数字、英文字母、小数点、下划线以及空格,各占一个字节,而一个汉字可能占 2~4 个字节,具体占多少个,取决于采用的编码方式。例如,汉字在 GBK/GB2312 编码中占用 2 个字节,而在 UTF-8 编码中一般占用 3 个字节。

以 UTF-8 编码为例,字符串“人生苦短,我用Python”所占用的字节数如下图所示。


我们可以通过使用 encode() 方法将字符串进行编码后再获取它的字节数。例如,采用 UTF-8 编码方式,计算“人生苦短,我用Python”的字节数,可以执行如下代码:

>>> str1 = "人生苦短,我用Python"
>>> len(str1.encode())
27

因为汉字加中文标点符号共 7 个,占 21 个字节,而英文字母和英文的标点符号占 6 个字节,一共占用 27 个字节。

同理,如果要获取采用 GBK 编码的字符串的长度,可以执行如下代码:

>>> str1 = "人生苦短,我用Python"
>>> len(str1.encode('gbk'))
20

split()

split() 方法可以实现将一个字符串按照指定的分隔符切分成多个子串,这些子串会被保存到列表中(不包含分隔符),作为方法的返回值反馈回来。

基本语法格式如下:

str.split(sep,maxsplit)

此方法中各部分参数的含义分别是:

  • str:表示要进行分割的字符串;
  • sep:用于指定分隔符,可以包含多个字符。此参数默认为 None,表示所有空字符,包括空格、换行符“\n”、制表符“\t”等。
  • maxsplit:可选参数,用于指定分割的次数,最后列表中子串的个数最多为 maxsplit+1。如果不指定或者指定为 -1,则表示分割次数没有限制。


在 split 方法中,如果不指定 sep 参数,需要以str.split(maxsplit=xxx)的格式指定 maxsplit 参数。

同内建函数(如 len)的使用方式不同,字符串变量所拥有的方法,只能采用“字符串.方法名()”的方式调用。

举例

>>> str = "C语言中文网 >>> c.biancheng.net"
>>> str
'C语言中文网 >>> c.biancheng.net'
>>> list1 = str.split() #采用默认分隔符进行分割
>>> list1
['C语言中文网', '>>>', 'c.biancheng.net']
>>> list2 = str.split('>>>') #采用多个字符进行分割
>>> list2
['C语言中文网 ', ' c.biancheng.net']
>>> list3 = str.split('.') #采用 . 号进行分割
>>> list3
['C语言中文网 >>> c', 'biancheng', 'net']
>>> list4 = str.split(' ',4) #采用空格进行分割,并规定最多只能分割成 4 个子串
>>> list4
['C语言中文网', '>>>', 'c.biancheng.net']
>>> list5 = str.split('>') #采用 > 字符进行分割
>>> list5
['C语言中文网 ', '', '', ' c.biancheng.net']
>>>

需要注意的是,在未指定 sep 参数时,split() 方法默认采用空字符进行分割但当字符串中有连续的空格或其他空字符时,都会被视为一个分隔符对字符串进行分割,

例如:

>>> str = "C语言中文网   >>>   c.biancheng.net"  #包含 3 个连续的空格
>>> list6 = str.split()
>>> list6
['C语言中文网', '>>>', 'c.biancheng.net']
>>>

join()

join() 方法用来将列表(或元组)中包含的多个字符串连接成一个字符串。

使用 join() 方法合并字符串时,它会将列表(或元组)中多个字符串采用固定的分隔符连接在一起。例如,字符串“c.biancheng.net”就可以看做是通过分隔符“.”将 ['c','biancheng','net'] 列表合并为一个字符串的结果。

语法格式如下:

newstr = str.join(iterable)

此方法中各参数的含义如下:

  • newstr:表示合并后生成的新字符串;
  • str:用于指定合并时的分隔符;
  • iterable:做合并操作的源字符串数据,允许以列表、元组等形式提供。

【例 1】将列表中的字符串合并成一个字符串。

>>> list = ['c','biancheng','net']
>>> '.'.join(list)
'c.biancheng.net'

【例 2】将元组中的字符串合并成一个字符串。

>>> dir = '','usr','bin','env'
>>> type(dir)
<class 'tuple'>
>>> '/'.join(dir)
'/usr/bin/env'

count()

count 方法用于检索指定字符串在另一字符串中出现的次数,如果检索的字符串不存在,则返回 0,否则返回出现的次数。

语法格式如下:

str.count(sub[,start[,end]])

此方法中,各参数的具体含义如下:

  • str:表示原字符串;
  • sub:表示要检索的字符串;
  • start:指定检索的起始位置,也就是从什么位置开始检测。如果不指定,默认从头开始检索;
  • end:指定检索的终止位置,如果不指定,则表示一直检索到结尾。

【例 1】检索字符串“c.biancheng.net”中“.”出现的次数。

>>> str = "c.biancheng.net"
>>> str.count('.')
2

【例 2】

>>> str = "c.biancheng.net"
>>> str.count('.',1)
2
>>> str.count('.',2)
1

【例 3】

>>> str = "c.biancheng.net"
>>> str.count('.',2,-3)
1
>>> str.count('.',2,-4)
0

find()

find() 方法用于检索字符串中是否包含目标字符串,如果包含,则返回第一次出现该字符串的索引;反之,则返回 -1。

语法格式如下:

str.find(sub[,start[,end]])

此格式中各参数的含义如下:

  • str:表示原字符串;
  • sub:表示要检索的目标字符串;
  • start:表示开始检索的起始位置。如果不指定,则默认从头开始检索;
  • end:表示结束检索的结束位置。如果不指定,则默认一直检索到结尾。

【例 1】用 find() 方法检索 “c.biancheng.net” 中首次出现 “.” 的位置索引。

>>> str = "c.biancheng.net"
>>> str.find('.')
1

【例 2】手动指定起始索引的位置。

>>> str = "c.biancheng.net"
>>> str.find('.',2)
11

【例 3】手动指定起始索引和结束索引的位置。

>>> str = "c.biancheng.net"
>>> str.find('.',2,-4)
-1

注意,Python还提供了 rfind() 方法,与 find() 方法最大的不同在于,rfind() 是从字符串右边开始检索。

例如:

>>> str = "c.biancheng.net"
>>> str.rfind('.')
11

index()

同 find() 方法类似,index() 方法也可以用于检索是否包含指定的字符串,不同之处在于,当指定的字符串不存在时,index() 方法会抛出异常。

语法格式如下:

str.index(sub[,start[,end]])

此格式中各参数的含义分别是:

  • str:表示原字符串;
  • sub:表示要检索的子字符串;
  • start:表示检索开始的起始位置,如果不指定,默认从头开始检索;
  • end:表示检索的结束位置,如果不指定,默认一直检索到结尾。

【例 1】用 index() 方法检索“c.biancheng.net”中首次出现“.”的位置索引。

>>> str = "c.biancheng.net"
>>> str.index('.')
1

【例 2】当检索失败时,index()会抛出异常。

>>> str = "c.biancheng.net"
>>> str.index('z')
Traceback (most recent call last):
  File "<pyshell#49>", line 1, in <module>
    str.index('z')
ValueError: substring not found

同 find() 和 rfind() 一样,字符串变量还具有 rindex() 方法,其作用和 index() 方法类似,不同之处在于它是从右边开始检索.

例如:

>>> str = "c.biancheng.net"
>>> str.rindex('.')
11

ljust()

ljust() 方法的功能是向指定字符串的右侧填充指定字符,从而达到左对齐文本的目的。

语法格式如下:

S.ljust(width[, fillchar])

其中各个参数的含义如下:

  • S:表示要进行填充的字符串;
  • width:表示包括 S 本身长度在内,字符串要占的总长度;
  • fillchar:作为可选参数,用来指定填充字符串时所用的字符,默认情况使用空格。

举例:

# ljust()举例
S = 'http://c.biancheng.net/python/'
addr = 'http://c.biancheng.net'
print(S.ljust(35))
print(addr.ljust(35))

输出结果为:

http://c.biancheng.net/python/     
http://c.biancheng.net     

注意,该输出结果中除了明显可见的网址字符串外,其后还有空格字符存在,每行一共 35 个字符长度。

举例:

# ljust()举例
S = 'http://c.biancheng.net/python/'
addr = 'http://c.biancheng.net'
print(S.ljust(35,'-'))
print(addr.ljust(35,'-'))

输出结果为:

http://c.biancheng.net/python/-----
http://c.biancheng.net-------------

rjust()

rjust() 方法是向字符串的左侧填充指定字符,从而达到右对齐文本的目的。

语法格式如下:

S.rjust(width[, fillchar])

其中各个参数的含义如下:

  • S:表示要进行填充的字符串;
  • width:表示包括 S 本身长度在内,字符串要占的总长度;
  • fillchar:作为可选参数,用来指定填充字符串时所用的字符,默认情况使用空格。

举例:

# rjust()举例
S = 'http://c.biancheng.net/python/'
addr = 'http://c.biancheng.net'
print(S.rjust(35))
print(addr.rjust(35))

输出结果为:

     http://c.biancheng.net/python/
             http://c.iancheng.net         

举例: 

# rjust()举例
S = 'http://c.biancheng.net/python/'
addr = 'http://c.biancheng.net'
print(S.rjust(35,'-'))
print(addr.rjust(35,'-'))

输出结果为:

-----http://c.biancheng.net/python/
-------------http://c.biancheng.net

center()

center() 字符串方法与 ljust() 和 rjust() 的用法类似,但它让文本居中,而不是左对齐或右对齐。

语法格式如下:

S.center(width[, fillchar])

其中各个参数的含义如下:

  • S:表示要进行填充的字符串;
  • width:表示包括 S 本身长度在内,字符串要占的总长度;
  • fillchar:作为可选参数,用来指定填充字符串时所用的字符,默认情况使用空格。

举例:

# center()举例
S = 'http://c.biancheng.net/python/'
addr = 'http://c.biancheng.net'
print(S.center(35,))
print(addr.center(35,))

输出结果为:

   http://c.biancheng.net/python/ 
       http://c.biancheng.net    

举例:

# center()举例
S = 'http://c.biancheng.net/python/'
addr = 'http://c.biancheng.net'
print(S.center(35,'-'))
print(addr.center(35,'-'))

输出结果为:

---http://c.biancheng.net/python/--
-------http://c.biancheng.net------

startswith()

startswith() 方法用于检索字符串是否以指定字符串开头,如果是返回 True;反之返回 False。

语法格式如下:

str.startswith(sub[,start[,end]])

此格式中各个参数的具体含义如下:

  • str:表示原字符串;
  • sub:要检索的子串;
  • start:指定检索开始的起始位置索引,如果不指定,则默认从头开始检索;
  • end:指定检索的结束位置索引,如果不指定,则默认一直检索在结束。

【例 1】判断“c.biancheng.net”是否以“c”子串开头。

>>> str = "c.biancheng.net"
>>> str.startswith("c")
True

【例 2】

>>> str = "c.biancheng.net"
>>> str.startswith("http")
False

【例 3】从指定位置开始检索。

>>> str = "c.biancheng.net"
>>> str.startswith("b",2)
True

endswith()

endswith() 方法用于检索字符串是否以指定字符串结尾,如果是则返回 True;反之则返回 False。

语法格式如下:

str.endswith(sub[,start[,end]])

此格式中各参数的含义如下:

  • str:表示原字符串;
  • sub:表示要检索的字符串;
  • start:指定检索开始时的起始位置索引(字符串第一个字符对应的索引值为 0),如果不指定,默认从头开始检索。
  • end:指定检索的结束位置索引,如果不指定,默认一直检索到结束。

【例 4】检索“c.biancheng.net”是否以“net”结束。

>>> str = "c.biancheng.net"
>>> str.endswith("net")
True

title()

title() 方法用于将字符串中每个单词的首字母转为大写,其他字母全部转为小写,转换完成后,此方法会返回转换得到的字符串。如果字符串中没有需要被转换的字符,此方法会将字符串原封不动地返回。

语法格式如下:

str.title()

其中,str 表示要进行转换的字符串。

【例 1】

>>> str = "c.biancheng.net"
>>> str.title()
'C.Biancheng.Net'
>>> str = "I LIKE C"
>>> str.title()
'I Like C'

lower()

lower() 方法用于将字符串中的所有大写字母转换为小写字母,转换完成后,该方法会返回新得到的字符串。如果字符串中原本就都是小写字母,则该方法会返回原字符串。

语法格式如下:

str.lower()

其中,str 表示要进行转换的字符串。

【例 2】

>>> str = "I LIKE C"
>>> str.lower()
'i like c'

upper()

upper() 的功能和 lower() 方法恰好相反,它用于将字符串中的所有小写字母转换为大写字母,和以上两种方法的返回方式相同,即如果转换成功,则返回新字符串;反之,则返回原字符串。

语法格式如下:

str.upper()

其中,str 表示要进行转换的字符串。

【例 3】

>>> str = "i like C"
>>> str.upper()
'I LIKE C'

需要注意的是,以上 3 个方法都仅限于将转换后的新字符串返回,而不会修改原字符串。

用户输入数据时,很有可能会无意中输入多余的空格,或者在一些场景中,字符串前后不允许出现空格和特殊字符,此时就需要去除字符串中的空格和特殊字符。

这里的特殊字符,指的是制表符(\t)、回车符(\r)、换行符(\n)等。

Python中,字符串变量提供了 3 种方法来删除字符串中多余的空格和特殊字符,它们分别是:

  1. strip():删除字符串前后(左右两侧)的空格或特殊字符。
  2. lstrip():删除字符串前面(左边)的空格或特殊字符。
  3. rstrip():删除字符串后面(右边)的空格或特殊字符。

strip()

strip() 方法用于删除字符串左右两个的空格和特殊字符。

语法格式为:

str.strip([chars])

其中,str 表示原字符串,[chars] 用来指定要删除的字符,可以同时指定多个,如果不手动指定,则默认会删除空格以及制表符、回车符、换行符等特殊字符。

【例 1】

>>> str = "  c.biancheng.net \t\n\r"
>>> str.strip()
'c.biancheng.net'
>>> str.strip(" ,\r")
'c.biancheng.net \t\n'
>>> str
'  c.biancheng.net \t\n\r'

lstrip()

lstrip() 方法用于去掉字符串左侧的空格和特殊字符。

语法格式如下:

str.lstrip([chars])

其中,str 表示原字符串,[chars] 用来指定要删除的字符,可以同时指定多个,如果不手动指定,则默认会删除空格以及制表符、回车符、换行符等特殊字符。

【例 2】

>>> str = "  c.biancheng.net \t\n\r"
>>> str.lstrip()
'c.biancheng.net \t\n\r'

rstrip()

rstrip() 方法用于删除字符串右侧的空格和特殊字符。

语法格式为:

str.rstrip([chars])

其中,str 表示原字符串,[chars] 用来指定要删除的字符,可以同时指定多个,如果不手动指定,则默认会删除空格以及制表符、回车符、换行符等特殊字符。

【例 3】

>>> str = "  c.biancheng.net \t\n\r"
>>> str.rstrip()
'  c.biancheng.net'

format()

format() 方法的作用是格式化字符串。

语法格式如下:

str.format(args)

此方法中,str 用于指定字符串的显示样式;args 用于指定要进行格式转换的项,如果有多项,之间有逗号进行分割。

format()在创建显示样式模板时,需要使用{}来指定占位符,其完整的语法格式为:

{ [index][ : [ [fill] align] [sign] [#] [width] [.precision] [type] ] }

注意,格式中用 [] 括起来的参数都是可选参数,即可以使用,也可以不使用。各个参数的含义如下:

  • index:指定:后边设置的格式要作用到 args 中第几个数据,数据的索引值从 0 开始。如果省略此选项,则会根据 args 中数据的先后顺序自动分配。
  • fill:指定空白处填充的字符。注意,当填充字符为逗号(,)且作用于整数或浮点数时,该整数(或浮点数)会以逗号分隔的形式输出,例如(1000000会输出 1,000,000)。
  • align:指定数据的对齐方式,具体的对齐方式如表 1 所示。
    表 1 align 参数及含义
    align含义
    <数据左对齐。
    >数据右对齐。
    =数据右对齐,同时将符号放置在填充内容的最左侧,该选项只对数字类型有效。
    ^数据居中,此选项需和 width 参数一起使用。
  • sign:指定有无符号数,此参数的值以及对应的含义如表 2 所示。
    表 2 sign 参数以含义
    sign参数含义
    +正数前加正号,负数前加负号。
    -正数前不加正号,负数前加负号。
    空格正数前加空格,负数前加负号。
    #对于二进制数、八进制数和十六进制数,使用此参数,各进制数前会分别显示 0b、0o、0x前缀;反之则不显示前缀。
  • width:指定输出数据时所占的宽度。
  • .precision:指定保留的小数位数。
  • type:指定输出数据的具体类型,如表 3 所示。
    表 3 type 占位符类型及含义
    type类型值含义
    s对字符串类型格式化。
    d十进制整数。
    c将十进制整数自动转换成对应的 Unicode 字符。
    e 或者 E 转换成科学计数法后,再格式化输出。
    g 或 G自动在 e 和 f(或 E 和 F)中切换。
    b将十进制数自动转换成二进制表示,再格式化输出。
    o将十进制数自动转换成八进制表示,再格式化输出。
    x 或者 X将十进制数自动转换成十六进制表示,再格式化输出。
    f 或者 F转换为浮点数(默认小数点后保留 6 位),再格式化输出。
    %显示百分比(默认显示小数点后 6 位)。


举例:

# format()举例
str="网站名称:{:>9s}\t网址:{:s}"
print(str.format("C语言中文网","c.biancheng.net"))

#以货币形式显示
print("货币形式:{:,d}".format(1000000))
#科学计数法表示
print("科学计数法:{:E}".format(1200.12))
#以十六进制表示
print("100的十六进制:{:#x}".format(100))
#输出百分比形式
print("0.01的百分比表示:{:.0%}".format(0.01))

运行结果为:

网站名称:   C语言中文网    网址:c.biancheng.net
货币形式:1,000,000
科学计数法:1.200120E+03
100的十六进制:0x64
0.01的百分比表示:1%

在 Python 中,有 2 种常用的字符串类型,分别为 str 和 bytes 类型,其中 str 用来表示 Unicode 字符,bytes 用来表示二进制数据。str 类型和 bytes 类型之间就需要使用 encode() 和 decode() 方法进行转换。

encode()

encode() 方法为字符串类型(str)提供的方法,用于将 str 类型转换成 bytes 类型,这个过程也称为“编码”。

语法格式如下:

str.encode([encoding="utf-8"][,errors="strict"])

注意

  • 格式中用 [] 括起来的参数为可选参数,
  • 使用 encode() 方法对原字符串进行编码,不会直接修改原字符串,如果想修改原字符串,需要重新赋值。
  • 该方法各个参数的含义如表 1 所示。
表 1 encode()参数及含义
参数含义
str表示要进行转换的字符串。
encoding = "utf-8"指定进行编码时采用的字符编码,该选项默认采用 utf-8 编码。例如,如果想使用简体中文,可以设置 gb2312。

当方法中只使用这一个参数时,可以省略前边的“encoding=”,直接写编码格式,例如 str.encode("UTF-8")。
errors = "strict"指定错误处理方式,其可选择值可以是:
  • strict:遇到非法字符就抛出异常。
  • ignore:忽略非法字符。
  • replace:用“?”替换非法字符。
  • xmlcharrefreplace:使用 xml 的字符引用。
该参数的默认值为 strict。

【例 1】将 str 类型字符串“C语言中文网”转换成 bytes 类型。

>>> str = "C语言中文网"
>>> str.encode()
b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x91'

此方式默认采用 UTF-8 编码,也可以手动指定其它编码格式,例如:

>>> str = "C语言中文网"
>>> str.encode('GBK')
b'C\xd3\xef\xd1\xd4\xd6\xd0\xce\xc4\xcd\xf8'


decode()

decode() 方法用于将 bytes 类型的二进制数据转换为 str 类型,这个过程也称为“解码”。

语法格式如下:

bytes.decode([encoding="utf-8"][,errors="strict"])

该方法中各参数的含义如表 2 所示。
 

表 2 decode()参数及含义
参数含义
bytes表示要进行转换的二进制数据。
encoding="utf-8"指定解码时采用的字符编码,默认采用 utf-8 格式。当方法中只使用这一个参数时,可以省略“encoding=”,直接写编码方式即可。

注意,对 bytes 类型数据解码,要选择和当初编码时一样的格式。
errors = "strict"指定错误处理方式,其可选择值可以是:
  • strict:遇到非法字符就抛出异常。
  • ignore:忽略非法字符。
  • replace:用“?”替换非法字符。
  • xmlcharrefreplace:使用 xml 的字符引用。
该参数的默认值为 strict。

【例 2】

>>> str = "C语言中文网"
>>> bytes=str.encode()
>>> bytes.decode()
'C语言中文网'

注意,如果编码时采用的不是默认的 UTF-8 编码,则解码时要选择和编码时一样的格式,否则会抛出异常。

例如:

>>> str = "C语言中文网"
>>> bytes = str.encode("GBK")
>>> bytes.decode()  #默认使用 UTF-8 编码,会抛出以下异常
Traceback (most recent call last):
  File "<pyshell#10>", line 1, in <module>
    bytes.decode()
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd3 in position 1: invalid continuation byte
>>> bytes.decode("GBK")
'C语言中文网'

总结

本文主要介绍了python中的字符串类型常用的几个方法。包括帮助查询字符串用法的dir()和help(),字符串拼接和截取字符串,获取字符串长度的len(),分割字符串的split(),合并字符串的join(),统计字符串出现次数的count(),检测字符串中是否包含某子串的find()和index(),字符串对齐的ljust(),rjust()和center(),检索字符串是否以指定字符串开头或结尾的startswith()和endswith(),字符串大小写转换的title(),lower(),upper(),去除字符串中指定字符的strip(),lstrip(),rstrip(),格式化字符串的format(),以及字符串编码和解码的encode(),decode()。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值