![v2-08fbbd3ff2275f36d096d821360a140d_1440w.jpg?source=172ae18b](http://img-02.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic1.zhimg.com/v2-08fbbd3ff2275f36d096d821360a140d_1440w.jpg?source=172ae18b)
一、字符串基本特点
字符串的本质是:字符序列
Python 的字符串是不可变的,无法对原字符串做任何修改。但可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。
Python 不支持单字符类型,单字符也是作为一个字符串使用的。
1、字符串的编码
Python3 直接支持 Unicode,可以表示世界上任何书面语言的字符。Python3 的字符默认就是 16 位 Unicode 编码,ASCII 码是 Unicode 编码的子集。
![v2-bd01b3987ddacf7fbb34a86991194264_b.jpg](http://img-01.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic1.zhimg.com/v2-bd01b3987ddacf7fbb34a86991194264_b.jpg)
(1)使用内置函数 ord()可以把字符转换成对应的 Unicode 码
(2)使用内置函数 chr()可以把十进制数字转换成对应的字符
>>>
2、引号创建字符串
(1)可以通过单引号或双引号创建字符串。
a
使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。
>>>
(2)连续三个单引号或三个双引号,可以创建多行字符串。
>>>
(3)空字符串和 len()函数
Python 允许空字符串的存在,不包含任何字符且长度为 0
>>>
len()用于计算字符串含有多少字符
>>>
3、转义字符
使用“+特殊字符”,实现某些难以用字符表示的效果。
![v2-4bd65bcb1ae6a16a1bdf83e5aeb94f9f_b.jpg](http://img-02.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic4.zhimg.com/v2-4bd65bcb1ae6a16a1bdf83e5aeb94f9f_b.jpg)
【操作】测试转义字符的使用
>>>
4、字符串拼接
(1) 可以使用 + 将多个字符串拼接起来。
>>>
- 如果+两边都是字符串,则拼接。
- 如果+两边都是数字,则加法运算。
- 如果+两边类型不同,则抛出异常。
2. 可以将多个字面字符串直接放到一起实现拼接。
【操作】字符串拼接操作
>>>
5、字符串复制
使用*可以实现字符串复制
【操作】字符串复制操作
>>>
6、不换行打印
前面调用 print 时,会自动打印一个换行符。有时,不想自动添加换行 符。可通过参数 end = “任意字符串”,实现末尾添加任何内容。
print
7、从控制台读取字符串
使用 input()从控制台读取键盘输入的内容
>>>
8、str()实现数字转型字符串
str()可将其他数据类型转换为字符串。
str(5.20) ==> ‘5.20’
str(3.14e2)==>’314.0’
str(True) ==> ‘True’
调用 print()函数时,解释器自动调用了 str()将非字符串的对象转成了字符串。
9、使用[]提取字符
字符串的本质就是字符序列,可通过在字符串后面添加[],在[]里面指定偏移量,可以提取该位置的单个字符。
正向搜索:
最左侧第一个字符,偏移量是 0,第二个偏移量是 1,以此类推。直到 len(str)-1 为止。
反向搜索:
最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str)为止。
【操作】使用[]提取字符串中的字符
>>>
10、replace()实现字符串替换
字符串是“不可改变”的,通过[]可以获取字符串指定位置的字符,但是仍然不能改变字符串。尝试改变字符串中某个字符,发现报错了:
>>>
但有时候需要替换某些字符,只能通过创建新的字符串来实现
>>>
整个过程中实际上是创建了新的字符串对象,并指向了变量 a,而不是修改了以前的字符串。
内存图如下:
![v2-019e4ca3697f89610db1a47be5fd0789_b.jpg](http://img-03.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic2.zhimg.com/v2-019e4ca3697f89610db1a47be5fd0789_b.jpg)
11、字符串切片 slice 操作
切片 slice 操作可以提取子字符串。标准格式为:
[起始偏移量 start:终止偏移量 end:步长 step]
典型操作(三个量为正数的情况)如下:
![v2-cd3100feb08498ab896c5ed07ebb4448_b.jpg](http://img-01.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic1.zhimg.com/v2-cd3100feb08498ab896c5ed07ebb4448_b.jpg)
其他操作(三个量为负数)的情况:
![v2-1d41e0662cadc29fda2202354fa0ed68_b.jpg](http://img-03.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic1.zhimg.com/v2-1d41e0662cadc29fda2202354fa0ed68_b.jpg)
注意:切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于 0 则会当做 [0:x],终止偏移量大于“长度-1”会被当成[x:-1]。例如:
>>>
【操作】
1. 将”to be or not to be”字符串倒序输出
>>>
2. 将"xinxinxinxin"字符串中所有的x输出
>>>
12、split()分割和 join()合并
(1)split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔
符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下:
>>>
(2)join()的作用和 split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:
>>>
**拼接字符串要点:
(1)使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。
(2)推荐使用 join 函数, join 函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。
【操作】测试+拼接符和 join(),不同的效率
import
**字符串驻留机制和字符串比较
(1)字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。
Python 支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母和数字)会启用字符串驻留机制驻留机制。
>>>
(2)字符串比较和同一性
使用==,!=对字符串进行比较,是否含有相同的字符。
使用 is / not is,判断两个对象是否同一个对象。比较的是对象的地址,即 id(obj1)是否和 id(obj2)相等。
(3)成员操作符
in /not in 关键字,判断某个字符(子字符串)是否存在于字符串中。
二、字符串常用方法
1、常用查找方法
以一段文本作为测试:
a = '''由于Python语言的简洁性、易读性以及可扩展性,在国外用Python做科学计算的研究机构日益增多,一些知名大学已经采用Python来教授程序设计课程。例如卡耐基梅隆大学的编程基础、麻省理工学院的计算机科学及编程导论就使用Python语言讲授。众多开源的科学计算软件包都提供了Python的调用接口,例如著名的计算机视觉库OpenCV、三维可视化库VTK、医学图像处理库ITK。而Python专用的科学计算扩展库就更多了,例如如下3个十分经典的科学计算扩展库:NumPy、SciPy和matplotlib,它们分别为Python提供了快速数组处理、数值运算以及绘图功能'''
![v2-f54dc8d8943bfcf22656069018ebf9c9_b.jpg](http://img-01.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic2.zhimg.com/v2-f54dc8d8943bfcf22656069018ebf9c9_b.jpg)
2、去除首尾信息
(1) strip()去除字符串首尾指定信息
(2) lstrip()去除字符串左边指定信息
(3) rstrip()去除字符串右边指定信息
【操作】去除字符串首尾信息
>>>
3、大小写转换
设定一个测试变量:
a = "xiaoxin love programming, love JJ"
![v2-81fb59288472c9fe8016383ad393511d_b.jpg](http://img-02.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic2.zhimg.com/v2-81fb59288472c9fe8016383ad393511d_b.jpg)
4、格式排版
center()、ljust()、rjust()这三个函数用于对字符串实现排版。
>>>
5、其他方法
1. isalnum() 是否为字母或数字
2. isalpha() 检测字符串是否只由字母组成(含汉字)。
3. isdigit() 检测字符串是否只由数字组成。
4. isspace() 检测是否为空白符
5. isupper() 是否为大写字母
6. islower() 是否为小写字母
>>>
三、字符串的格式化
1、format()基本用法
基本语法是通过 {} 和 : 来代替以前的 % 。
format 函数可以接受多个参数,位置可以不按顺序。 可通过{索引}/{参数名},直接映射参数值,实现对字符串的格式化。
>>>
2、填充与对齐
填充常跟对齐一起使用
^、<、>分别是居中、左对齐、右对齐,后面带宽度
:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充
>>>
3、数字格式化
浮点数通过 f,整数通过 d 进行需要的格式化。
>>>
![v2-4dde80a58800c2455488ff79e19f0898_b.jpg](http://img-03.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic1.zhimg.com/v2-4dde80a58800c2455488ff79e19f0898_b.jpg)
四、可变字符串
在 Python 中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,只能创建新的字符串对象。但经常需要原地修改字符串,可以使用 io.StringIO 对象或 array 模块。
>>>
![v2-e01c8b1dc978633738bf97526065b4cb_b.jpg](http://img-01.proxy.5ce.com/view/image?&type=2&guid=6d87de92-7113-eb11-8da9-e4434bdf6706&url=https://pic4.zhimg.com/v2-e01c8b1dc978633738bf97526065b4cb_b.jpg)