目录
一、字符串的格式
字符串类型是指由一系列字符组成的序列,通常用单引号、双引号或三引号来表示。
str1 = 'Hello, world!'
str2 = "Hello, world!"
str3 = '''Hello,
world!'''
二、字符串编码解码
1、字符串编码
编码是将字符串转换为字节序列的过程。在 Python 中,常用的字符串编码方式包括 ASCII、UTF-8、UTF-16 等。
使用字符串的 encode() 方法可以将字符串编码为指定的字节序列。
例如,将字符串 “Hello” 使用 UTF-8 编码为字节序列:
string = "Hello"
encoded = string.encode("utf-8")
print(encoded) # 输出:b'Hello'
2、字符串解码
解码是将字节序列转换为字符串的过程。
使用字节序列的 decode() 方法可以将字节序列解码为指定的字符串。
例如,将 UTF-8 编码的字节序列解码为字符串:
encoded = b'Hello'
decoded = encoded.decode("utf-8")
print(decoded) # 输出:Hello
3、默认编码
在字符串的编码和解码过程中,如果不指定编码方式,则会使用默认的编码方式。
默认的编码方式是根据操作系统和环境的设置来决定的,可以使用 sys.getdefaultencoding() 方法获取当前的默认编码方式。
import sys
default_encoding = sys.getdefaultencoding()
print(default_encoding) # 输出:utf-8
1、encode 的作用是将其它编码的字符串转换成 unicode 编码。
2、decode 的作用是将 unicode 编码转换成其它编码的字符串。
3、字符串在 python 内部表示的是 Unicode 编码,因此,在做编码转换时,通常需要以 Unicode 作为中间编码, 即先将其它编码的字符串解码(decode)成 Unicode,再从 Unicode 编码(encode)成另一种编码。
4、Python3 在进行文件操作和网络通信都是使用 bytes 进行的,所以对于 str 类型要进行编码后才能写入文件或网络。
三、字符串运算符
1、+
用于将两个字符串连接在一起。
string1 = "Hello"
string2 = "World"
result = string1 + string2
print(result) # 输出:HelloWorld
2、*
用于将一个字符串重复多次。
string = "Hello"
result = string * 3
print(result) # 输出:HelloHelloHello
3、in、not in
用于检查一个子串是否存在于字符串中。
string = "Hello World"
print("Hello" in string) # 输出:True
print("Python" not in string) # 输出:True
4、==、!=、<、>、<=、>=
用于比较两个字符串的大小关系,按照字典序进行比较。
string1 = "abc"
string2 = "def"
print(string1 == string2) # 输出:False
print(string1 < string2) # 输出:True
5、len()
用于获取字符串的长度,即字符串中字符的个数。
string = "Hello"
length = len(string)
print(length) # 输出:5
四、索引和切片
1、字符串索引
字符串中的每个字符都有一个对应的索引值,从左到右从0开始递增,从右到左从-1开始递减。
可以使用方括号 [] 和索引值来访问字符串中的特定字符。
例如,对于字符串 “Hello”,索引 H 的值为 0,索引 e 的值为 1,以此类推。
string = "Hello"
print(string[0]) # 输出:H
print(string[1]) # 输出:e
print(string[-1]) # 输出:o
2、字符串切片
切片用于从字符串中提取子串。
通过指定起始索引和结束索引,使用冒号 : 来执行切片操作。切片范围是左闭右开区间。
例如,对于字符串 “Hello”,切片 [1:4] 提取了索引 1 到 3(不包括索引 4)之间的字符。
string = "Hello"
print(string[1:4]) # 输出:ell
3、切片的可选参数
切片操作可以包含可选的第三个参数,即步长(step),用于指定提取子串时的间隔。
默认情况下,步长为 1,即连续提取字符。
例如,对于字符串 “Hello World”,切片 [0:11:2] 提取了索引为偶数位置的字符。
string = "Hello World"
print(string[0:11:2]) # 输出:HloWrd
4、省略参数的切片
如果省略起始索引,则默认从字符串的开头开始切片。
如果省略结束索引,则默认切片到字符串的末尾。
例如,对于字符串 “Hello”,切片 [:3] 提取了索引 0 到 2(不包括索引 3)之间的字符。
string = "Hello"
print(string[:3]) # 输出:Hel
print(string[3:]) # 输出:lo
5、负数索引和切片
负数索引和切片可以从字符串的末尾开始计数。
例如,对于字符串 “Hello”,切片 [-3:-1] 提取了倒数第三个字符和倒数第二个字符。
string = "Hello"
print(string[-3:-1]) # 输出:ll
五、格式化输出
字符串格式化是一种将变量插入到字符串中的方式,用于构建动态的字符串。
1、百分号(%)格式化
使用百分号(%)作为格式化操作符,将变量的值插入到字符串中的占位符位置。
name = "Alice"
age = 25
result = "My name is %s and I am %d years old." % (name, age)
print(result)
# 输出:My name is Alice and I am 25 years old.
2、str.format() 方法格式化
使用 str.format() 方法,将变量的值插入到字符串中的占位符位置。
在占位符中可以指定变量的索引、宽度、对齐方式等格式。
name = "Alice"
age = 25
result = "My name is {} and I am {} years old.".format(name, age)
print(result)
# 输出:My name is Alice and I am 25 years old.
3、f-string 格式化
使用以字母 “f” 开头的字符串,可以在字符串中直接使用变量,并在变量名前加上前缀 “f”。
name = "Alice"
age = 25
result = f"My name is {name} and I am {age} years old."
print(result)
# 输出:My name is Alice and I am 25 years old.
4、字符串模板(Template)
使用 string.Template 类,将变量的值插入到带有占位符的字符串中。
占位符使用 ${} 包围,可以在字符串中指定默认值和格式控制。
from string import Template
name = "Alice"
age = 25
template = Template("My name is ${name} and I am ${age} years old.")
result = template.substitute(name=name, age=age)
print(result)
# 输出:My name is Alice and I am 25 years old.
5、格式化选项和类型
在格式化操作中使用选项和类型来控制变量的显示方式,例如字段宽度、精度、对齐等。
number = 3.1415926
result = "The value of pi is {:.2f}".format(number)
print(result)
# 输出:The value of pi is 3.14
六、常用函数
1、find()
查找子字符串第一次出现的位置,返回索引值。如果未找到,返回-1。
string = "Hello World"
result = string.find("World")
print(result) # 输出:6
string = "Hello World"
result = string.find("Python")
print(result) # 输出:-1
2、index()
查找子字符串第一次出现的位置,返回索引值。如果未找到,会引发ValueError。
string = "Hello World"
result = string.index("World")
print(result) # 输出:6
string = "Hello World"
result = string.index("Python") # 引发ValueError ValueError: substring not found
3、count()
统计子字符串在字符串中出现的次数。
string = "Hello World"
result = string.count("o")
print(result) # 输出:2
string = "Hello World"
result = string.count("Python")
print(result) # 输出:0
4、replace()
将字符串中的指定子字符串替换为新的子字符串。
string = "Hello World"
result = string.replace("World", "Python")
print(result) # 输出:Hello Python
5、split()
将字符串拆分为子字符串列表,使用指定的分隔符。
string = "Hello,World,Python"
result = string.split(",")
print(result) # 输出:['Hello', 'World', 'Python']
6、join()
将列表中的字符串元素连接成一个字符串,使用指定的分隔符。
list = ['Hello', 'World', 'Python']
result = ",".join(list)
print(result) # 输出:Hello,World,Python
7、capitalize()
将字符串的第一个字符转换为大写,其它字符转换为小写。
string = "hello world"
result = string.capitalize()
print(result) # 输出:Hello world
8、title()
将字符串中每个单词的首字母转换为大写。
string = "hello world"
result = string.title()
print(result) # 输出:Hello World
9、startswith()
检查字符串是否以指定的前缀开头。
string = "Hello World"
result = string.startswith("Hello")
print(result) # 输出:True
string = "Hello World"
result = string.startswith("World")
print(result) # 输出:False
10、endswith()
检查字符串是否以指定的后缀结尾。
string = "Hello World"
result = string.endswith("World")
print(result) # 输出:True
string = "Hello World"
result = string.endswith("Hello")
print(result) # 输出:False
11、lower()
将字符串中所有字符转换为小写。
string = "Hello World"
result = string.lower()
print(result) # 输出:hello world
12、upper()
将字符串中所有字符转换为大写。
string = "Hello World"
result = string.upper()
print(result) # 输出:HELLO WORLD
13、strip()
去除字符串两侧的空格字符。
string = " Hello World "
result = string.strip()
print(result) # 输出:Hello World
14、ljust()
将字符串左对齐,并使用指定的填充字符在右侧填充指定长度。
string = "Hello"
result = string.ljust(10, "-")
print(result) # 输出:Hello-----
15、rjust()
将字符串右对齐,并使用指定的填充字符在左侧填充指定长度。
string = "Hello"
result = string.rjust(10, "-")
print(result) # 输出:-----Hello
16、center()
将字符串居中对齐,并使用指定的填充字符在两侧填充指定长度。
string = "Hello"
result = string.center(10, "-")
print(result) # 输出:--Hello---
17、lstrip()
去除字符串左侧的空格字符。
string = " Hello World "
result = string.lstrip()
print(result) # 输出:Hello World
18、rstrip()
去除字符串右侧的空格字符。
string = " Hello World "
result = string.rstrip()
print(result) # 输出: Hello World
19、rfind()
查找子字符串最后一次出现的位置,返回索引值。如果未找到,返回-1。
string = "Hello World Hello"
result = string.rfind("Hello")
print(result) # 输出:12
string = "Hello World Hello"
result = string.rfind("Python")
print(result) # 输出:-1
20、rindex()
查找子字符串最后一次出现的位置,返回索引值。如果未找到,会引发ValueError。
string = "Hello World Hello"
result = string.rindex("Hello")
print(result) # 输出:12
string = "Hello World Hello"
result = string.rindex("Python") # 引发ValueError ValueError: substring not found
21、partition()
将字符串从第一次出现的指定子字符串位置分割成三部分,返回一个包含分割结果的元组。
string = "Hello World"
result = string.partition(" ")
print(result) # 输出:('Hello', ' ', 'World')
22、rpartition()
将字符串从最后一次出现的指定子字符串位置分割成三部分,返回一个包含分割结果的元组。
string = "Hello World Hello"
result = string.rpartition("Hello")
print(result) # 输出:('Hello World ', 'Hello', '')
23、splitlines()
将字符串按行拆分为字符串列表。
string = "Hello\nWorld\nPython"
result = string.splitlines()
print(result) # 输出:['Hello', 'World', 'Python']
24、isalpha()
检查字符串是否只包含字母字符。
string = "Hello"
result = string.isalpha()
print(result) # 输出:True
string ="Hello123"
result = string.isalpha()
print(result) # 输出:False
25、isdigit()
检查字符串是否只包含数字字符。
string = "12345"
result = string.isdigit()
print(result) # 输出:True
string = "123abc"
result = string.isdigit()
print(result) # 输出:False
26、isalnum()
检查字符串是否只包含字母和数字字符。
string = "Hello123"
result = string.isalnum()
print(result) # 输出:True
string = "Hello123!"
result = string.isalnum()
print(result) # 输出:False
27、isspace()
检查字符串是否只包含空格字符。
string = " "
result = string.isspace()
print(result) # 输出:True
string = " Hello "
result = string.isspace()
print(result) # 输出:False
28、casefold()
将字符串转换为小写,并进行 Unicode 规范化,用于比较字符串时消除大小写差异。
string = "Hello World"
result = string.casefold()
print(result) # 输出:hello world
29、encode()
将字符串编码为指定的字节编码格式。
string = "Hello World"
result = string.encode("utf-8")
print(result) # 输出:b'Hello World'
30、expandtabs()
将字符串中的制表符转换为空格,并根据指定的制表符大小调整字符串的对齐。
string = "Hello\tWorld"
result = string.expandtabs(4)
print(result) # 输出:Hello World
31、format()
将字符串作为格式化模板,并使用传递的参数进行格式化。
name = "Alice"
age = 25
result = "My name is {}, and I am {} years old.".format(name, age)
print(result) # 输出:My name is Alice, and I am 25 years old.
32、format_map()
将字符串作为格式化模板,并使用传递的字典参数进行格式化。
person = {"name": "Bob", "age": 30}
result = "My name is {name}, and I am {age} years old.".format_map(person)
print(result) # 输出:My name is Bob, and I am 30 years old.
33、isdecimal()
检查字符串是否只包含十进制数字字符。
string = "12345"
result = string.isdecimal()
print(result) # 输出:True
string = "12.34"
result = string.isdecimal()
print(result) # 输出:False
34、isidentifier()
检查字符串是否是一个有效的标识符(变量名)。
string = "hello"
result = string.isidentifier()
print(result) # 输出:True
string = "123"
result = string.isidentifier()
print(result) # 输出:False
35、islower()
检查字符串是否只包含小写字母字符。
string = "hello"
result = string.islower()
print(result) # 输出:True
string = "Hello"
result = string.islower()
print(result) # 输出:False
36、isnumeric()
检查字符串是否只包含数字字符。
string = "12345"
result = string.isnumeric()
print(result) # 输出:True
string = "123abc"
result = string.isnumeric()
print(result) # 输出:False
37、isprintable()
检查字符串是否只包含可打印字符。如果字符串为空或仅包含空格,则返回 True。
string = "Hello World"
result = string.isprintable()
print(result) # 输出:True
string = "Hello\nWorld"
result = string.isprintable()
print(result) # 输出:False
38、isupper()
检查字符串是否只包含大写字母字符。
string = "HELLO"
result = string.isupper()
print(result) # 输出:True
string = "Hello"
result = string.isupper()
print(result) # 输出:False
39、maketrans()
创建字符映射转换表,用于字符串的替换操作。
table = str.maketrans("aeiou", "12345")
string = "Hello World"
result = string.translate(table)
print(result) # 输出:H2ll4 W4rld
40、rsplit()
将字符串从右侧开始按指定的分隔符拆分,并返回拆分后的子字符串列表。
string = "Hello World Python"
result = string.rsplit(" ", 1)
print(result) # 输出:['Hello World', 'Python']
41、swapcase()
将字符串中的大写字母转换为小写字母,小写字母转换为大写字母。
string = "Hello World"
result = string.swapcase()
print(result) # 输出:hELLO wORLD
42、translate()
使用字符映射转换表进行字符串的替换操作。
table = str.maketrans("aeiou", "12345")
string = "Hello World"
result = string.translate(table)
print(result) # 输出:H2ll4 W4rld
43、zfill()
在字符串的左侧使用零字符填充,使字符串达到指定的宽度。
string = "42"
result = string.zfill(5)
print(result) # 输出:00042
以上列出一些常用方法。
如想获取关于字符串的所有函数,可使用以下代码查看。
print(dir(str))
# 输出:['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']
记录学习过程,欢迎讨论交流,尊重原创,转载请注明出处~