Python字符串常用方法详解

本文详细讲解了Python字符串的各种操作,包括字符串拼接(数字与字符串的结合)、字符串截取(通过切片获取单个或多个字符)、len()函数获取字符串长度、分割与连接字符串的方法(split()和join())、统计子串出现次数的count()方法、查找子串的find()和index()方法、字符串对齐方法(ljust(), rjust(), center())、大小写转换(title(), lower(), upper())、去除空格的方法(strip(), lstrip(), rstrip())以及格式化输出的format()方法。此外,还介绍了字符串与数字的转换、编码转换的encode()和decode(),以及dir()和help()辅助函数的使用。" 3111308,42959,嵌入式Linux引导解析:Xloader的Xloader_Entry深入探究,"['嵌入式开发', 'Linux', '硬件初始化', '程序引导']
摘要由CSDN通过智能技术生成

Python字符串常用方法详解

在了解字符串的基本使用之后,本章将介绍 Python 字符串类型常用的几个方法。

在 Python 开发过程中,经常需要对字符串进行一些特殊处理,比如拼接字符串、截取字符串、格式化字符串等,这些操作无需开发者自己设计实现,只需调用相应的字符串方法即可。

注意,本章所讲的字符串方法,和内置函数(如 len() )不同,它们是字符串类型(str)所特有的,因此这些字符串方法的调用方式也比较特殊。

Python字符串拼接(包含字符串拼接数字)

Python 中拼接(连接)字符串很简单,可以直接将两个字符串紧挨着写在一起,具体格式为:

strname = "str1" "str2"

strname 表示拼接以后的字符串变量名,str1 和 str2 是要拼接的字符串内容。使用这种写法,Python 会自动将两个字符串拼接在一起。

【示例】以连续书写的形式拼接字符串:

str1 = "Python教程" "http://c.biancheng.net/python/"print(str1)
str2 = "Java" "Python" "C++" "PHP"
print(str2)

运行结果:

Python教程http://c.biancheng.net/python/
JavaPythonC++PHP

需要注意的是,这种写法只能拼接字符串常量。

如果需要使用变量,就得借助+运算符来拼接,具体格式为:

strname = str1 + str2

当然,+运算符也能拼接字符串常量。

【示例】使用+运算符拼接字符串:

name = "C++教程"url = "http://c.biancheng.net/cplus/"
info = name + "的网址是:" + url
print(info)

运行结果:

C++教程的网址是:http://c.biancheng.net/cplus/

Python字符串和数字的拼接

在很多应用场景中,我们需要将字符串和数字拼接在一起,而 Python 不允许直接拼接数字和字符串,所以我们必须先将数字转换成字符串。可以借助 str() 和 repr() 函数将数字转换为字符串,它们的使用格式为:

str(obj)
repr(obj)

obj 表示要转换的对象,它可以是数字、列表、元组、字典等多种类型的数据。

请看下面的代码:

name = "C语言中文网"
age = 8
course = 30
info = name + "已经" + str(age) + "岁了,共发布了" + repr(course) + "套教程。"
print(info)

运行结果:

C语言中文网已经8岁了,共发布了30套教程。
str() 和 repr() 的区别

str() 和 repr() 函数虽然都可以将数字转换成字符串,但它们之间是有区别的:

  • str() 用于将数据转换成适合人类阅读的字符串形式。
  • repr() 用于将数据转换成适合解释器阅读的字符串形式(Python 表达式的形式),适合在开发和调试阶段使用;如果没有等价的语法,则会发生 SyntaxError 异常。

请看下面的例子:

s = "http://c.biancheng.net/shell/"
s_str = str(s)
s_repr = repr(s)
print( type(s_str) )
print (s_str)
print( type(s_repr) )
print (s_repr)

运行结果:

<class 'str'>
http://c.biancheng.net/shell/
<class 'str'>
'http://c.biancheng.net/shell/'

本例中,s 本身就是一个字符串,但是我们依然使用 str() 和 repr() 对它进行了转换。从运行结果可以看出,str() 保留了字符串最原始的样子,而 repr() 使用引号将字符串包围起来,这就是 Python 字符串的表达式形式。

另外,在 Python 交互式编程环境中输入一个表达式(变量、加减乘除、逻辑运算等)时,Python 会自动使用 repr() 函数处理该表达式。

Python截取字符串(字符串切片)方法详解

从本质上讲,字符串是由多个字符构成的,字符之间是有顺序的,这个顺序号就称为索引(index)。Python 允许通过索引来操作字符串中的单个或者多个字符,比如获取指定索引处的字符,返回指定字符的索引值等。

获取单个字符

知道字符串名字以后,在方括号[ ]中使用索引即可访问对应的字符,具体的语法格式为:

strname[index]

strname 表示字符串名字,index 表示索引值。

Python 允许从字符串的两端使用索引:

  • 当以字符串的左端(字符串的开头)为起点时,索引是从 0 开始计数的;字符串的第一个字符的索引为 0,第二个字符的索引为 1,第三个字符串的索引为 2 ……
  • 当以字符串的右端(字符串的末尾)为起点时,索引是从 -1 开始计数的;字符串的倒数第一个字符的索引为 -1,倒数第二个字符的索引为 -2,倒数第三个字符的索引为 -3 ……

请看下面的实例演示:

url = 'http://c.biancheng.net/python/'
#获取索引为10的字符
print(url[10])
#获取索引为 6 的字符
print(url[-6])

运行结果:

i
y

获取多个字符(字符串截去/字符串切片)

使用[ ]除了可以获取单个字符外,还可以指定一个范围来获取多个字符,也就是一个子串或者片段,具体格式为:

strname[start : end : step]

对各个部分的说明:

  • strname:要截取的字符串;
  • start:表示要截取的第一个字符所在的索引(截取时包含该字符)。如果不指定,默认为 0,也就是从字符串的开头截取;
  • end:表示要截取的最后一个字符所在的索引(截取时不包含该字符)。如果不指定,默认为字符串的长度;
  • step:指的是从 start 索引处的字符开始,每 step 个距离获取一个字符,直至 end 索引出的字符。step 默认值为 1,当省略该值时,最后一个冒号也可以省略。

【实例1】基本用法:

url = 'http://c.biancheng.net/java/'

#获取索引从3处22(不包含22)的子串
print(url[7: 22]) 

# 输出 zy#获取索引从7处到-6的子串
print(url[7: -6]) 

# 输出 zyit.org is very
#获取索引从-7到6的子串
print(url[-21: -6])

#从索引3开始,每隔4个字符取出一个字符,直到索引22为止
print(url[3: 22: 4])

运行结果:

c.biancheng.net
c.biancheng.net
c.biancheng.net
pcaen

【实例2】高级用法,start、end、step 三个参数都可以省略:

url = 'http://c.biancheng.net/java/'

#获取从索引5开始,直到末尾的子串
print(url[7: ])

#获取从索引-21开始,直到末尾的子串
print(url[-21: ])

#从开头截取字符串,直到索引22为止
print(url[: 22])

#每隔3个字符取出一个字符
print(url[:: 3])

运行结果:

c.biancheng.net/java/
c.biancheng.net/java/
http://c.biancheng.net
hp/bne.ta/

Python len()函数详解:获取字符串长度或字节数

Python 中,要想知道一个字符串有多少个字符(获得字符串长度),或者一个字符串占用多少个字节,可以使用 len 函数。

len 函数的基本语法格式为:

len(string)

其中 string 用于指定要进行长度统计的字符串。

例如,定义一个字符串,内容为“http://c.biancheng.net”,然后用 len() 函数计算该字符串的长度,执行代码如下:

>>> a='http://c.biancheng.net'
>>> len(a)
22

在实际开发中,除了常常要获取字符串的长度外,有时还要获取字符串的字节数。

在 Python 中,不同的字符所占的字节数不同,数字、英文字母、小数点、下划线以及空格,各占一个字节,而一个汉字可能占 2~4 个字节,具体占多少个,取决于采用的编码方式。例如,汉字在 GBK/GB2312 编码中占用 2 个字节,而在 UTF-8 编码中一般占用 3 个字节。

以 UTF-8 编码为例,字符串“人生苦短,我用Python”所占用的字节数如图 1 所示。

img
图 1 汉字和英文所占字节数

我们可以通过使用 encode() 方法,将字符串进行编码后再获取它的字节数。例如,采用 UTF-8 编码方式,计算“人生苦短,我用Python”的字节数,可以执行如下代码:

>>> str1 = "人生苦短,我用Python"
>>> len(str1.encode())
27

因为汉字加中文标点符号共 7 个,占 21 个字节,而英文字母和英文的标点符号占 6 个字节,一共占用 27 个字节。

同理,如果要获取采用 GBK 编码的字符串的长度,可以执行如下代码:

>>> str1 = "人生苦短,我用Python"
>>> len(str1.encode('gbk'))
20

字符串分割、连接方法

Python split()方法详解:分割字符串

Python 中,除了可以使用一些内建函数获取字符串的相关信息外(例如 len() 函数获取字符串长度),字符串类型本身也拥有一些方法供我们使用。

注意,这里所说的方法,指的是字符串类型 str 本身所提供的,由于涉及到类和对象的知识,初学者不必深究,只需要知道方法的具体用法即可。

从本节开始,将给大家介绍一些常用的字符串类型方法,本节先介绍分割字符串的 split() 方法。

split() 方法可以实现将一个字符串按照指定的分隔符切分成多个子串,这些子串会被保存到列表中(不包含分隔符),作为方法的返回值反馈回来。该方法的基本语法格式如下:

str.split(sep,maxsplit)

此方法中各部分参数的含义分别是:

  1. str:表示要进行分割的字符串;
  2. sep:用于指定分隔符,可以包含多个字符。此参数默认为 None,表示所有空字符,包括空格、换行符“\n”、制表符“\t”等。
  3. maxsplit:可选参数,用于指定分割的次数,最后列表中子串的个数最多为 maxsplit+1。如果不指定或者指定为 -1,则表示分割次数没有限制。

在 split 方法中,如果不指定 sep 参数,那么也不能指定 maxsplit 参数。

同内建函数(如 len)的使用方式不同,字符串变量所拥有的方法,只能采用“字符串.方法名()”的方式调用。这里不用纠结为什么,学完类和对象之后,自然会明白。

例如,定义一个保存 C语言中文网网址的字符串,然后用 split() 方法根据不同的分隔符进行分隔,执行过程如下:

>>> str = "C语言中文网 >>> c.biancheng.net"
>>> str
'C语言中文网 >>> c.biancheng.net'
>>> list1 = str.split() #采用默认分隔符进行分割
>>> list1
['C语言中文网', '>>&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值