字符串

字符串基本特点

字符串的本质是:字符序列。Python 的字符串是不可变的,我们无法对原字符串做任 何修改。但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。 Python 不支持单字符类型,单字符也是作为一个字符串使用的。

字符串的编码

Python3 直接支持 Unicode,可以表示世界上任何书面语言的字符。Python3 的字符 默认就是 16 位 Unicode 编码,ASCII 码是 Unicode 编码的子集。
使用内置函数 ord()可以把字符转换成对应的 Unicode 码;
使用内置函数 chr()可以把十进制数字转换成对应的字符。

引号创建字符串

我们可以通过单引号或双引号创建字符串。例如:a=’abc’; b=”sxt” 使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。
连续三个单引号或三个双引号,可以帮助我们创建多行字符串。

空字符串和 len()函数

Python 允许空字符串的存在,不包含任何字符且长度为 0。
len()用于计算字符串含有多少字符。

转义字符

我们可以使用“+特殊字符”,实现某些难以用字符表示的效果。比如:换行等。常见的 转义字符有这些:

转义字符描述
(\在行尾时)续行符
\反斜杠符号
单引号
"双引号
\b退格(Backspace)
\n换行
\t横向制表符
\r回车

字符串拼接

  1. 可以使用+将多个字符串拼接起来。例如:’aa’+ ’bb’ ==>’aabb’。
    (1) 如果+两边都是字符串,则拼接。
    (2) 如果+两边都是数字,则加法运算。
    (3) 如果+两边类型不同,则抛出异常。
  2. 可以将多个字面字符串直接放到一起实现拼接。例如:’aa’’bb’==>’aabb’
  3. 字符串复制 使用*可以实现字符串复制

不换行打印

我们前面调用 print 时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行 符。我们可以自己通过参数 end = “任意字符串”。实现末尾添加任何内容:

print("编程",end="")
print("人生",end="###")

运行结果:

编程人生###

从控制台读取字符串

我们可以使用 input()从控制台读取键盘输入的内容。

name = input("请输入名字:")

运行结果:

请输入名字:

str()实现数字转型字符串

str()可以帮助我们将其他数据类型转换为字符串。

例如: str(5.20) ==>5.20str(3.14e2)==>314.0str(True) ==>True

当我们调用 print()函数时,解释器自动调用了 str()将非字符串的对象转成了字符串。

使用[]提取字符

字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量, 可以提取该位置的单个字符。
正向搜索: 最左侧第一个字符,偏移量是 0,第二个偏移量是 1,以此类推。直到 len(str)-1 为止。 反向搜索: 最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str) 为止

replace()实现字符串替换

字符串是“不可改变”的,我们通过[]可以获取字符串指定位置的字符,但是我们不能改变 字符串。
字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符 串来实现。
整个过程中,实际上我们是创建了新的字符串对象,并指向了变量 a,而不是修改了以前的 字符串。

字符串切片 slice 操作

切片 slice 操作可以让我们快速的提取子字符串。
标准格式为: [起始偏移量 start:终止偏移量 end:步长 step]
典型操作(三个量为正数的情况)如下:

操作和说明示例结果
[:] 提取整个字符串“abcdef”[:]“abcdef”
[start:]从 start 索引开始到结尾“abcdef”[2:]“cdef”
[:end]从头开始知道 end-1“abcdef”[:2]“ab”
[start:end]从 start 到 end-1“abcdef”[2:4]“cd”
[start : end:step]从 start 提取到 end-1,步长是 step“abcdef”[1:5:2]“bd "

其他操作(三个量为负数)的情况:

示例说明结果
“abcdefghijklmnopqrstuv wxyz”[-3:] 倒数三个“xyz”
“abcdefghijklmnopqrstuv wxyz”[-8:-3]倒数第八个到倒数第 三个(包头不包尾)‘stuvw’
“abcdefghijklmnopqrstuv wxyz”[::-1]步长为负,从右到左 反向提取‘zyxwvutsrqpon mlkjihgfedcba’

切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始 偏移量小于 0 则会当做 0,终止偏移量大于“长度-1”会被当成-1。例如: >>> “abcdefg”[3:50] ‘defg’ 我们发现正常输出了结果,没有报错。

split()分割和 join()合并

split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔 符,则默认使用空白字符(换行符/空格/制表符)。

a = "to be or not to be"
print(a.split())

运行结果如下:

['to', 'be', 'or', 'not', 'to', 'be']

join()的作用和 split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:

b = ['to', 'be', 'or', 'not', 'to', 'be']
print("*".join(a))

运行结果如下:

to*be*or*not*to*be

拼接字符串要点: 使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。推荐 使用 join 函数,因为 join 函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝, 仅新建一次对象。

字符串驻留机制和字符串比较

字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。 Python 支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母 和数字)会启用字符串驻留机制驻留机制,在编译器中全部优化了都可以了

>>> a = "abd_33" 
>>> b = "abd_33"
>>> a is b 
True 
>>> c = "dd#" 
>>> d = "dd#" 
>>> c is d 
>False   #在编译器中是True
>>> str1 = "aa" 
>>> str2 = "bb" 
>>> str1+str2 is "aabb"
False 
>>> str1+str2 == "aabb" 
True 

字符串比较和同一性

我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。 我们使用 is / not is,判断两个对象是否同一个对象。比较的是对象的地址,即 id(obj1)是 否和 id(obj2)相等

成员操作符

in /not in 关键字,判断某个字符(子字符串)是否存在于字符串中。

字符串常用方法汇总

方法说明
capitalize()将字符串的第一个字符转换为大写
center(width, fillchar)返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。
count(str, beg= 0,end=len(string))返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数
bytes.decode(encoding=“utf-8”, errors=“strict”)Python3 中没有 decode 方法,但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象,这个 bytes 对象可以由 str.encode() 来编码返回。
encode(encoding=‘UTF-8’,errors=‘strict’)以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是’ignore’或者’replace’
endswith(suffix, beg=0, end=len(string))检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False.
expandtabs(tabsize=8)把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 。
find(str, beg=0, end=len(string))检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1
index(str, beg=0, end=len(string))跟find()方法一样,只不过如果str不在字符串中会报一个异常.
isalnum()如果字符串至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False
isalpha()如果字符串至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
isdigit()如果字符串只包含数字则返回 True 否则返回 False…
islower()如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False
isnumeric()如果字符串中只包含数字字符,则返回 True,否则返回 False
isspace()如果字符串中只包含空白,则返回 True,否则返回 False.
istitle()如果字符串是标题化的(见 title())则返回 True,否则返回 False
isupper()如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False
join(seq)以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
len(string)返回字符串长度
ljust(width[, fillchar])返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格。
lower()转换字符串中所有大写字符为小写.
lstrip()截掉字符串左边的空格或指定字符。
截掉字符串左边的空格或指定字符。创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。
max(str)返回字符串 str 中最大的字母。
min(str)返回字符串 str 中最小的字母。
replace(old, new [, max])把 将字符串中的 str1 替换成 str2,如果 max 指定,则替换不超过 max 次。
rfind(str, beg=0,end=len(string))类似于 find()函数,不过是从右边开始查找.
rindex( str, beg=0, end=len(string))类似于 index(),不过是从右边开始.
rjust(width,[, fillchar])返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串
rstrip()删除字符串字符串末尾的空格.
split(str="", num=string.count(str))num=string.count(str))以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num+1 个子字符串
splitlines([keepends])按照行(’\r’, ‘\r\n’, \n’)分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。
startswith(substr, beg=0,end=len(string))检查字符串是否是以指定子字符串 substr 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。
strip([chars])在字符串上执行 lstrip()和 rstrip()
swapcase()将字符串中大写转换为小写,小写转换为大写
title()返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle())
translate(table, deletechars="")根据 str 给出的表(包含 256 个字符)转换 string 的字符,
要过滤掉的字符放到 deletechars 参数中
upper()转换字符串中的小写字母为大写
zfill (width)返回长度为 width 的字符串,原字符串右对齐,前面填充0
isdecimal()检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。

字符串的格式化

format()基本用法 Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的 功能。 基本语法是通过 {} 和 : 来代替以前的 % 。 format 函数可以接受不限个参数,位置可以不按顺序。
我们可以通过{索引}/{参数名},直接映射参数值,实现对字符串的格式化,非常方便。

填充与对齐

填充常跟对齐一起使用 ^、<、>分别是居中、左对齐、右对齐,后面带宽度 :号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

数字格式化

浮点数通过 f,整数通过 d 进行需要的格式化。如下表

数字格式输出描述
3.1415926{:.2f}3.14保留小数点后两位
3.1415926{:+.2f}3.14带符号保留小数点后两位
2.71828{:.0f}3不带小数
5{:0>2d}05数字补零 (填充左边, 宽度为 2)
5{:x<4d}5xxx数字补 x (填充右边, 宽度为 4)
10{:x<4d}10xx数字补 x (填充右边, 宽度为 4)
1000000{:,}1,000,000以逗号分隔的数字格式
0.25{:.2%}25.00%百分比格式
1000000000{:.2e}1.00E+09指数记法
13{:10d}13右对齐 (默认, 宽度为 10)
13{:<10d}13左对齐 (宽度为 10)
13{:^10d}13中间对齐 (宽度为 10)

可变字符串

在 Python 中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智 能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用 io.StringIO 对象或 array 模块。

import io
s = "hello,world"
sio = io.StringIO(s)
print(sio.getvalue())
print(sio.seek(7))
print(sio.write("人"))
print(sio.getvalue())

运行结果如下:

hello,world
7
1
hello,w人rld

注意:
字符串的分割还有partition()这种方式。
partition(sep) --> (head,sep,tail)
从左向右遇到分隔符把字符串分割成两部分,返回头、分割符、尾三部分的三元组。如果没有找到分割符,就返回头、尾两个空元素的三元组。

s1 = "I’m a good student"
# 以'good'为分割符,返回头、分割符、尾三部分。
s2 = s1.partition("good")
# 没有找到分割符'abc',返回头、尾两个空元素的元组。
s3 = s1.partition('abc')
print(s1)
print(s2)
print(s3)

运行结果如下:

I’m a good student
('I’m a ', 'good', ' student')
('I’m a good student', '', '')
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值