Python 笔记 — 基本数据类型(二)字符串类型

一、字符串的格式

字符串类型是指由一系列字符组成的序列,通常用单引号双引号三引号来表示。

str1 = 'Hello, world!'
str2 = "Hello, world!"
str3 = '''Hello,
          world!'''

二、字符串编码解码

1、字符串编码

编码是将字符串转换为字节序列的过程。在 Python 中,常用的字符串编码方式包括 ASCII、UTF-8、UTF-16 等。
使用字符串的 encode() 方法可以将字符串编码为指定的字节序列。
例如,将字符串 “Hello” 使用 UTF-8 编码为字节序列:

string = "Hello"
encoded = string.encode("utf-8")
print(encoded)  # 输出:b'Hello'

2、字符串解码

解码是将字节序列转换为字符串的过程。
使用字节序列的 decode() 方法可以将字节序列解码为指定的字符串。
例如,将 UTF-8 编码的字节序列解码为字符串:

encoded = b'Hello'
decoded = encoded.decode("utf-8")
print(decoded)  # 输出:Hello

3、默认编码

在字符串的编码和解码过程中,如果不指定编码方式,则会使用默认的编码方式。
默认编码方式是根据操作系统环境的设置来决定的,可以使用 sys.getdefaultencoding() 方法获取当前的默认编码方式。

import sys

default_encoding = sys.getdefaultencoding()
print(default_encoding)  # 输出:utf-8

1、encode 的作用是将其它编码的字符串转换成 unicode 编码。
2、decode 的作用是将 unicode 编码转换成其它编码的字符串。
3、字符串在 python 内部表示的是 Unicode 编码,因此,在做编码转换时,通常需要以 Unicode 作为中间编码, 即先将其它编码的字符串解码(decode)成 Unicode,再从 Unicode 编码(encode)成另一种编码。
4、Python3 在进行文件操作和网络通信都是使用 bytes 进行的,所以对于 str 类型要进行编码后才能写入文件或网络。

三、字符串运算符

1、+

用于将两个字符串连接在一起。

string1 = "Hello"
string2 = "World"
result = string1 + string2
print(result)  # 输出:HelloWorld

2、*

用于将一个字符串重复多次。

string = "Hello"
result = string * 3
print(result)  # 输出:HelloHelloHello

3、in、not in

用于检查一个子串是否存在于字符串中。

string = "Hello World"
print("Hello" in string)  # 输出:True
print("Python" not in string)  # 输出:True

4、==、!=、<、>、<=、>=

用于比较两个字符串的大小关系,按照字典序进行比较。

string1 = "abc"
string2 = "def"
print(string1 == string2)  # 输出:False
print(string1 < string2)  # 输出:True

5、len()

用于获取字符串的长度,即字符串中字符的个数。

string = "Hello"
length = len(string)
print(length)  # 输出:5

四、索引和切片

1、字符串索引

字符串中的每个字符都有一个对应索引值,从左到右从0开始递增,从右到左从-1开始递减。
可以使用方括号 [] 和索引值来访问字符串中的特定字符。
例如,对于字符串 “Hello”,索引 H 的值为 0,索引 e 的值为 1,以此类推。

string = "Hello"
print(string[0])  # 输出:H
print(string[1])  # 输出:e
print(string[-1])  # 输出:o

2、字符串切片

切片用于从字符串中提取子串
通过指定起始索引和结束索引,使用冒号 : 来执行切片操作。切片范围是左闭右开区间。
例如,对于字符串 “Hello”,切片 [1:4] 提取了索引 1 到 3(不包括索引 4)之间的字符。

string = "Hello"
print(string[1:4])  # 输出:ell

3、切片的可选参数

切片操作可以包含可选的第三个参数,即步长(step),用于指定提取子串时的间隔
默认情况下,步长为 1,即连续提取字符。
例如,对于字符串 “Hello World”,切片 [0:11:2] 提取了索引为偶数位置的字符。

string = "Hello World"
print(string[0:11:2])  # 输出:HloWrd

4、省略参数的切片

如果省略起始索引,则默认从字符串的开头开始切片。
如果省略结束索引,则默认切片到字符串的末尾。
例如,对于字符串 “Hello”,切片 [:3] 提取了索引 0 到 2(不包括索引 3)之间的字符。

string = "Hello"
print(string[:3])  # 输出:Hel
print(string[3:])  # 输出:lo

5、负数索引和切片

负数索引和切片可以从字符串的末尾开始计数。
例如,对于字符串 “Hello”,切片 [-3:-1] 提取了倒数第三个字符和倒数第二个字符。

string = "Hello"
print(string[-3:-1])  # 输出:ll

五、格式化输出

字符串格式化是一种将变量插入到字符串中的方式,用于构建动态的字符串。

1、百分号(%)格式化

使用百分号(%)作为格式化操作符,将变量的值插入到字符串中的占位符位置。

name = "Alice"
age = 25
result = "My name is %s and I am %d years old." % (name, age)
print(result)
# 输出:My name is Alice and I am 25 years old.

2、str.format() 方法格式化

使用 str.format() 方法,将变量的值插入到字符串中的占位符位置。
在占位符中可以指定变量的索引、宽度、对齐方式等格式。

name = "Alice"
age = 25
result = "My name is {} and I am {} years old.".format(name, age)
print(result)
# 输出:My name is Alice and I am 25 years old.

3、f-string 格式化

使用以字母 “f” 开头的字符串,可以在字符串中直接使用变量,并在变量名前加上前缀 “f”。

name = "Alice"
age = 25
result = f"My name is {name} and I am {age} years old."
print(result)
# 输出:My name is Alice and I am 25 years old.

4、字符串模板(Template)

使用 string.Template 类,将变量的值插入到带有占位符的字符串中。
占位符使用 ${} 包围,可以在字符串中指定默认值和格式控制。

from string import Template

name = "Alice"
age = 25
template = Template("My name is ${name} and I am ${age} years old.")
result = template.substitute(name=name, age=age)
print(result)
# 输出:My name is Alice and I am 25 years old.

5、格式化选项和类型

在格式化操作中使用选项和类型来控制变量的显示方式,例如字段宽度、精度、对齐等。

number = 3.1415926
result = "The value of pi is {:.2f}".format(number)
print(result)
# 输出:The value of pi is 3.14

六、常用函数

1、find()
查找子字符串第一次出现的位置,返回索引值。如果未找到,返回-1。

string = "Hello World"
result = string.find("World")
print(result)  # 输出:6

string = "Hello World"
result = string.find("Python")
print(result)  # 输出:-1

2、index()
查找子字符串第一次出现的位置,返回索引值。如果未找到,会引发ValueError。

string = "Hello World"
result = string.index("World")
print(result)  # 输出:6

string = "Hello World"
result = string.index("Python")  # 引发ValueError ValueError: substring not found

3、count()
统计子字符串在字符串中出现的次数。

string = "Hello World"
result = string.count("o")
print(result)  # 输出:2

string = "Hello World"
result = string.count("Python")
print(result)  # 输出:0

4、replace()
将字符串中的指定子字符串替换为新的子字符串。

string = "Hello World"
result = string.replace("World", "Python")
print(result)  # 输出:Hello Python

5、split()
将字符串拆分为子字符串列表,使用指定的分隔符。

string = "Hello,World,Python"
result = string.split(",")
print(result)  # 输出:['Hello', 'World', 'Python']

6、join()
将列表中的字符串元素连接成一个字符串,使用指定的分隔符。

list = ['Hello', 'World', 'Python']
result = ",".join(list)
print(result)  # 输出:Hello,World,Python

7、capitalize()
将字符串的第一个字符转换为大写,其它字符转换为小写。

string = "hello world"
result = string.capitalize()
print(result)  # 输出:Hello world

8、title()
将字符串中每个单词的首字母转换为大写。

string = "hello world"
result = string.title()
print(result)  # 输出:Hello World

9、startswith()
检查字符串是否以指定的前缀开头。

string = "Hello World"
result = string.startswith("Hello")
print(result)  # 输出:True

string = "Hello World"
result = string.startswith("World")
print(result)  # 输出:False

10、endswith()
检查字符串是否以指定的后缀结尾。

string = "Hello World"
result = string.endswith("World")
print(result)  # 输出:True

string = "Hello World"
result = string.endswith("Hello")
print(result)  # 输出:False

11、lower()
将字符串中所有字符转换为小写。

string = "Hello World"
result = string.lower()
print(result)  # 输出:hello world

12、upper()
将字符串中所有字符转换为大写。

string = "Hello World"
result = string.upper()
print(result)  # 输出:HELLO WORLD

13、strip()
去除字符串两侧的空格字符。

string = "   Hello World   "
result = string.strip()
print(result)  # 输出:Hello World

14、ljust()
将字符串左对齐,并使用指定的填充字符在右侧填充指定长度。

string = "Hello"
result = string.ljust(10, "-")
print(result)  # 输出:Hello-----

15、rjust()
将字符串右对齐,并使用指定的填充字符在左侧填充指定长度。

string = "Hello"
result = string.rjust(10, "-")
print(result)  # 输出:-----Hello

16、center()
将字符串居中对齐,并使用指定的填充字符在两侧填充指定长度。

string = "Hello"
result = string.center(10, "-")
print(result)  # 输出:--Hello---

17、lstrip()
去除字符串左侧的空格字符。

string = "   Hello World   "
result = string.lstrip()
print(result)  # 输出:Hello World  

18、rstrip()
去除字符串右侧的空格字符。

string = "   Hello World   "
result = string.rstrip()
print(result)  # 输出:   Hello World

19、rfind()
查找子字符串最后一次出现的位置,返回索引值。如果未找到,返回-1。

string = "Hello World Hello"
result = string.rfind("Hello")
print(result)  # 输出:12

string = "Hello World Hello"
result = string.rfind("Python")
print(result)  # 输出:-1

20、rindex()
查找子字符串最后一次出现的位置,返回索引值。如果未找到,会引发ValueError。

string = "Hello World Hello"
result = string.rindex("Hello")
print(result)  # 输出:12

string = "Hello World Hello"
result = string.rindex("Python")  # 引发ValueError ValueError: substring not found

21、partition()
将字符串从第一次出现的指定子字符串位置分割成三部分,返回一个包含分割结果的元组。

string = "Hello World"
result = string.partition(" ")
print(result)  # 输出:('Hello', ' ', 'World')

22、rpartition()
将字符串从最后一次出现的指定子字符串位置分割成三部分,返回一个包含分割结果的元组。

string = "Hello World Hello"
result = string.rpartition("Hello")
print(result)  # 输出:('Hello World ', 'Hello', '')

23、splitlines()
将字符串按行拆分为字符串列表。

string = "Hello\nWorld\nPython"
result = string.splitlines()
print(result)  # 输出:['Hello', 'World', 'Python']

24、isalpha()
检查字符串是否只包含字母字符。

string = "Hello"
result = string.isalpha()
print(result)  # 输出:True

string ="Hello123"
result = string.isalpha()
print(result) # 输出:False

25、isdigit()
检查字符串是否只包含数字字符。

string = "12345"
result = string.isdigit()
print(result)  # 输出:True

string = "123abc"
result = string.isdigit()
print(result)  # 输出:False

26、isalnum()
检查字符串是否只包含字母和数字字符。

string = "Hello123"
result = string.isalnum()
print(result)  # 输出:True

string = "Hello123!"
result = string.isalnum()
print(result)  # 输出:False

27、isspace()
检查字符串是否只包含空格字符。

string = "   "
result = string.isspace()
print(result)  # 输出:True

string = "  Hello  "
result = string.isspace()
print(result)  # 输出:False

28、casefold()
将字符串转换为小写,并进行 Unicode 规范化,用于比较字符串时消除大小写差异。

string = "Hello World"
result = string.casefold()
print(result)  # 输出:hello world

29、encode()
将字符串编码为指定的字节编码格式。

string = "Hello World"
result = string.encode("utf-8")
print(result)  # 输出:b'Hello World'

30、expandtabs()
将字符串中的制表符转换为空格,并根据指定的制表符大小调整字符串的对齐。

string = "Hello\tWorld"
result = string.expandtabs(4)
print(result)  # 输出:Hello   World

31、format()
将字符串作为格式化模板,并使用传递的参数进行格式化。

name = "Alice"
age = 25
result = "My name is {}, and I am {} years old.".format(name, age)
print(result)  # 输出:My name is Alice, and I am 25 years old.

32、format_map()
将字符串作为格式化模板,并使用传递的字典参数进行格式化。

person = {"name": "Bob", "age": 30}
result = "My name is {name}, and I am {age} years old.".format_map(person)
print(result)  # 输出:My name is Bob, and I am 30 years old.

33、isdecimal()
检查字符串是否只包含十进制数字字符。

string = "12345"
result = string.isdecimal()
print(result)  # 输出:True

string = "12.34"
result = string.isdecimal()
print(result)  # 输出:False

34、isidentifier()
检查字符串是否是一个有效的标识符(变量名)。

string = "hello"
result = string.isidentifier()
print(result)  # 输出:True

string = "123"
result = string.isidentifier()
print(result)  # 输出:False

35、islower()
检查字符串是否只包含小写字母字符。

string = "hello"
result = string.islower()
print(result)  # 输出:True

string = "Hello"
result = string.islower()
print(result)  # 输出:False

36、isnumeric()
检查字符串是否只包含数字字符。

string = "12345"
result = string.isnumeric()
print(result)  # 输出:True

string = "123abc"
result = string.isnumeric()
print(result)  # 输出:False

37、isprintable()
检查字符串是否只包含可打印字符。如果字符串为空或仅包含空格,则返回 True。

string = "Hello World"
result = string.isprintable()
print(result)  # 输出:True

string = "Hello\nWorld"
result = string.isprintable()
print(result)  # 输出:False

38、isupper()
检查字符串是否只包含大写字母字符。

string = "HELLO"
result = string.isupper()
print(result)  # 输出:True

string = "Hello"
result = string.isupper()
print(result)  # 输出:False

39、maketrans()
创建字符映射转换表,用于字符串的替换操作。

table = str.maketrans("aeiou", "12345")
string = "Hello World"
result = string.translate(table)
print(result)  # 输出:H2ll4 W4rld

40、rsplit()
将字符串从右侧开始按指定的分隔符拆分,并返回拆分后的子字符串列表。

string = "Hello World Python"
result = string.rsplit(" ", 1)
print(result)  # 输出:['Hello World', 'Python']

41、swapcase()
将字符串中的大写字母转换为小写字母,小写字母转换为大写字母。

string = "Hello World"
result = string.swapcase()
print(result)  # 输出:hELLO wORLD

42、translate()
使用字符映射转换表进行字符串的替换操作。

table = str.maketrans("aeiou", "12345")
string = "Hello World"
result = string.translate(table)
print(result)  # 输出:H2ll4 W4rld

43、zfill()
在字符串的左侧使用零字符填充,使字符串达到指定的宽度。

string = "42"
result = string.zfill(5)
print(result)  # 输出:00042

以上列出一些常用方法。
如想获取关于字符串的所有函数,可使用以下代码查看。

print(dir(str))
# 输出:['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']

记录学习过程,欢迎讨论交流,尊重原创,转载请注明出处~

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值