字符串

最新推荐文章于 2024-03-25 11:59:50 发布

码农阳神

最新推荐文章于 2024-03-25 11:59:50 发布

阅读量195

点赞数

分类专栏：人工智能

本文链接：https://blog.csdn.net/qq_44797965/article/details/104216289

版权

人工智能专栏收录该内容

48 篇文章 1 订阅

订阅专栏

字符串基本特点

字符串的本质是：字符序列。Python 的字符串是不可变的，我们无法对原字符串做任何修改。但，可以将字符串的一部分复制到新创建的字符串，达到“看起来修改”的效果。 Python 不支持单字符类型，单字符也是作为一个字符串使用的。

字符串的编码

Python3 直接支持 Unicode，可以表示世界上任何书面语言的字符。Python3 的字符默认就是 16 位 Unicode 编码，ASCII 码是 Unicode 编码的子集。
使用内置函数 ord()可以把字符转换成对应的 Unicode 码；
使用内置函数 chr()可以把十进制数字转换成对应的字符。

引号创建字符串

我们可以通过单引号或双引号创建字符串。例如：a=’abc’; b=”sxt” 使用两种引号的好处是可以创建本身就包含引号的字符串，而不用使用转义字符。
连续三个单引号或三个双引号，可以帮助我们创建多行字符串。

空字符串和 len()函数

Python 允许空字符串的存在，不包含任何字符且长度为 0。
len()用于计算字符串含有多少字符。

转义字符

我们可以使用“+特殊字符”，实现某些难以用字符表示的效果。比如：换行等。常见的转义字符有这些：

转义字符	描述
(\在行尾时)	续行符
\	反斜杠符号
’	单引号
"	双引号
\b	退格(Backspace)
\n	换行
\t	横向制表符
\r	回车

字符串拼接

可以使用+将多个字符串拼接起来。例如：’aa’+ ’bb’ ==>’aabb’。
(1) 如果+两边都是字符串，则拼接。
(2) 如果+两边都是数字，则加法运算。
(3) 如果+两边类型不同，则抛出异常。
可以将多个字面字符串直接放到一起实现拼接。例如：’aa’’bb’==>’aabb’
字符串复制使用*可以实现字符串复制

不换行打印

我们前面调用 print 时，会自动打印一个换行符。有时，我们不想换行，不想自动添加换行符。我们可以自己通过参数 end = “任意字符串”。实现末尾添加任何内容：

print("编程",end="")
print("人生",end="###")

运行结果:

编程人生###

从控制台读取字符串

我们可以使用 input()从控制台读取键盘输入的内容。

name = input("请输入名字:")

运行结果:

请输入名字:

str()实现数字转型字符串

str()可以帮助我们将其他数据类型转换为字符串。

例如： str(5.20) ==> ‘5.20’ str(3.14e2)==>’314.0’ str(True) ==> ‘True’

当我们调用 print()函数时，解释器自动调用了 str()将非字符串的对象转成了字符串。

使用[]提取字符

字符串的本质就是字符序列，我们可以通过在字符串后面添加[]，在[]里面指定偏移量，可以提取该位置的单个字符。
正向搜索：最左侧第一个字符，偏移量是 0，第二个偏移量是 1，以此类推。直到 len(str)-1 为止。反向搜索：最右侧第一个字符，偏移量是-1，倒数第二个偏移量是-2，以此类推，直到-len(str) 为止

replace()实现字符串替换

字符串是“不可改变”的，我们通过[]可以获取字符串指定位置的字符，但是我们不能改变字符串。
字符串不可改变。但是，我们确实有时候需要替换某些字符。这时，只能通过创建新的字符串来实现。
整个过程中，实际上我们是创建了新的字符串对象，并指向了变量 a，而不是修改了以前的字符串。

字符串切片 slice 操作

切片 slice 操作可以让我们快速的提取子字符串。
标准格式为： [起始偏移量 start：终止偏移量 end：步长 step]
典型操作(三个量为正数的情况)如下：

操作和说明	示例	结果
[:] 提取整个字符串	“abcdef”[:]	“abcdef”
[start:]从 start 索引开始到结尾	“abcdef”[2:]	“cdef”
[:end]从头开始知道 end-1	“abcdef”[:2]	“ab”
[start:end]从 start 到 end-1	“abcdef”[2:4]	“cd”
[start : end:step]从 start 提取到 end-1，步长是 step	“abcdef”[1:5:2]	“bd "

其他操作（三个量为负数）的情况：

示例	说明	结果
“abcdefghijklmnopqrstuv wxyz”[-3:] 倒数三个	“xyz”
“abcdefghijklmnopqrstuv wxyz”[-8:-3]	倒数第八个到倒数第三个(包头不包尾)	‘stuvw’
“abcdefghijklmnopqrstuv wxyz”[::-1]	步长为负，从右到左反向提取	‘zyxwvutsrqpon mlkjihgfedcba’

切片操作时，起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围，也不会报错。起始偏移量小于 0 则会当做 0，终止偏移量大于“长度-1”会被当成-1。例如： >>> “abcdefg”[3:50] ‘defg’ 我们发现正常输出了结果，没有报错。

split()分割和 join()合并

split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符，则默认使用空白字符(换行符/空格/制表符)。

a = "to be or not to be"
print(a.split())

运行结果如下:

['to', 'be', 'or', 'not', 'to', 'be']

join()的作用和 split()作用刚好相反，用于将一系列子字符串连接起来。示例代码如下：

b = ['to', 'be', 'or', 'not', 'to', 'be']
print("*".join(a))

运行结果如下:

to*be*or*not*to*be

拼接字符串要点：使用字符串拼接符+，会生成新的字符串对象，因此不推荐使用+来拼接字符串。推荐使用 join 函数，因为 join 函数在拼接字符串之前会计算所有字符串的长度，然后逐一拷贝，仅新建一次对象。

字符串驻留机制和字符串比较

字符串驻留：仅保存一份相同且不可变字符串的方法，不同的值被存放在字符串驻留池中。 Python 支持字符串驻留机制，对于符合标识符规则的字符串（仅包含下划线（_）、字母和数字）会启用字符串驻留机制驻留机制,在编译器中全部优化了都可以了。

>>> a = "abd_33" 
>>> b = "abd_33"
>>> a is b 
True 
>>> c = "dd#" 
>>> d = "dd#" 
>>> c is d 
>False   #在编译器中是True
>>> str1 = "aa" 
>>> str2 = "bb" 
>>> str1+str2 is "aabb"
False 
>>> str1+str2 == "aabb" 
True

字符串比较和同一性

我们可以直接使用==,!=对字符串进行比较，是否含有相同的字符。我们使用 is / not is，判断两个对象是否同一个对象。比较的是对象的地址，即 id(obj1)是否和 id(obj2)相等

成员操作符

in /not in 关键字，判断某个字符(子字符串)是否存在于字符串中。

字符串常用方法汇总

方法	说明
capitalize()	将字符串的第一个字符转换为大写
center(width, fillchar)	返回一个指定的宽度 width 居中的字符串，fillchar 为填充的字符，默认为空格。
count(str, beg= 0,end=len(string))	返回 str 在 string 里面出现的次数，如果 beg 或者 end 指定则返回指定范围内 str 出现的次数
bytes.decode(encoding=“utf-8”, errors=“strict”)	Python3 中没有 decode 方法，但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象，这个 bytes 对象可以由 str.encode() 来编码返回。
encode(encoding=‘UTF-8’,errors=‘strict’)	以 encoding 指定的编码格式编码字符串，如果出错默认报一个ValueError 的异常，除非 errors 指定的是’ignore’或者’replace’
endswith(suffix, beg=0, end=len(string))	检查字符串是否以 obj 结束，如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束，如果是，返回 True,否则返回 False.
expandtabs(tabsize=8)	把字符串 string 中的 tab 符号转为空格，tab 符号默认的空格数是 8 。
find(str, beg=0, end=len(string))	检测 str 是否包含在字符串中，如果指定范围 beg 和 end ，则检查是否包含在指定范围内，如果包含返回开始的索引值，否则返回-1
index(str, beg=0, end=len(string))	跟find()方法一样，只不过如果str不在字符串中会报一个异常.
isalnum()	如果字符串至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False
isalpha()	如果字符串至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
isdigit()	如果字符串只包含数字则返回 True 否则返回 False…
islower()	如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回 True，否则返回 False
isnumeric()	如果字符串中只包含数字字符，则返回 True，否则返回 False
isspace()	如果字符串中只包含空白，则返回 True，否则返回 False.
istitle()	如果字符串是标题化的(见 title())则返回 True，否则返回 False
isupper()	如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False
join(seq)	以指定字符串作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
len(string)	返回字符串长度
ljust(width[, fillchar])	返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串，fillchar 默认为空格。
lower()	转换字符串中所有大写字符为小写.
lstrip()	截掉字符串左边的空格或指定字符。
截掉字符串左边的空格或指定字符。	创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。
max(str)	返回字符串 str 中最大的字母。
min(str)	返回字符串 str 中最小的字母。
replace(old, new [, max])	把将字符串中的 str1 替换成 str2,如果 max 指定，则替换不超过 max 次。
rfind(str, beg=0,end=len(string))	类似于 find()函数，不过是从右边开始查找.
rindex( str, beg=0, end=len(string))	类似于 index()，不过是从右边开始.
rjust(width,[, fillchar])	返回一个原字符串右对齐,并使用fillchar(默认空格）填充至长度 width 的新字符串
rstrip()	删除字符串字符串末尾的空格.
split(str="", num=string.count(str))	num=string.count(str))以 str 为分隔符截取字符串，如果 num 有指定值，则仅截取 num+1 个子字符串
splitlines([keepends])	按照行(’\r’, ‘\r\n’, \n’)分隔，返回一个包含各行作为元素的列表，如果参数 keepends 为 False，不包含换行符，如果为 True，则保留换行符。
startswith(substr, beg=0,end=len(string))	检查字符串是否是以指定子字符串 substr 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查。
strip([chars])	在字符串上执行 lstrip()和 rstrip()
swapcase()	将字符串中大写转换为小写，小写转换为大写
title()	返回"标题化"的字符串,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())
translate(table, deletechars="")	根据 str 给出的表(包含 256 个字符)转换 string 的字符,
要过滤掉的字符放到 deletechars 参数中
upper()	转换字符串中的小写字母为大写
zfill (width)	返回长度为 width 的字符串，原字符串右对齐，前面填充0
isdecimal()	检查字符串是否只包含十进制字符，如果是返回 true，否则返回 false。

字符串的格式化

format()基本用法 Python2.6 开始，新增了一种格式化字符串的函数 str.format()，它增强了字符串格式化的功能。基本语法是通过 {} 和 : 来代替以前的 % 。 format 函数可以接受不限个参数，位置可以不按顺序。
我们可以通过{索引}/{参数名}，直接映射参数值，实现对字符串的格式化，非常方便。

填充与对齐

填充常跟对齐一起使用 ^、<、>分别是居中、左对齐、右对齐，后面带宽度 :号后面带填充的字符，只能是一个字符，不指定的话默认是用空格填充

数字格式化

浮点数通过 f，整数通过 d 进行需要的格式化。如下表

数字	格式	输出	描述
3.1415926	{:.2f}	3.14	保留小数点后两位
3.1415926	{:+.2f}	3.14	带符号保留小数点后两位
2.71828	{:.0f}	3	不带小数
5	{:0>2d}	05	数字补零 (填充左边, 宽度为 2)
5	{:x<4d}	5xxx	数字补 x (填充右边, 宽度为 4)
10	{:x<4d}	10xx	数字补 x (填充右边, 宽度为 4)
1000000	{:,}	1,000,000	以逗号分隔的数字格式
0.25	{:.2%}	25.00%	百分比格式
1000000000	{:.2e}	1.00E+09	指数记法
13	{:10d}	13	右对齐 (默认, 宽度为 10)
13	{:<10d}	13	左对齐 (宽度为 10)
13	{:^10d}	13	中间对齐 (宽度为 10)

可变字符串

在 Python 中，字符串属于不可变对象，不支持原地修改，如果需要修改其中的值，智能创建新的字符串对象。但是，经常我们确实需要原地修改字符串，可以使用 io.StringIO 对象或 array 模块。

import io
s = "hello,world"
sio = io.StringIO(s)
print(sio.getvalue())
print(sio.seek(7))
print(sio.write("人"))
print(sio.getvalue())

运行结果如下:

hello,world
7
1
hello,w人rld

注意：
字符串的分割还有partition()这种方式。
partition(sep) --> (head,sep,tail)
从左向右遇到分隔符把字符串分割成两部分，返回头、分割符、尾三部分的三元组。如果没有找到分割符，就返回头、尾两个空元素的三元组。

s1 = "I’m a good student"
# 以'good'为分割符，返回头、分割符、尾三部分。
s2 = s1.partition("good")
# 没有找到分割符'abc'，返回头、尾两个空元素的元组。
s3 = s1.partition('abc')
print(s1)
print(s2)
print(s3)

运行结果如下:

I’m a good student
('I’m a ', 'good', ' student')
('I’m a good student', '', '')

码农阳神

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
字符串

字符串基本特点字符串的本质是：字符序列。Python 的字符串是不可变的，我们无法对原字符串做任何修改。但，可以将字符串的一部分复制到新创建的字符串，达到“看起来修改”的效果。 Python 不支持单字符类型，单字符也是作为一个字符串使用的。字符串的编码Python3 直接支持 Unicode，可以表示世界上任何书面语言的字符。Python3 的字符默认就是 16 位 Unicode 编...
复制链接

扫一扫

专栏目录