字符串基本特点
字符串的本质是:字符序列。Python的字符串是不可变的,我们无法对原字符串做任何修改。但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。
Python不支持单字符类型选,单字符也是作为一个字符串使用的。
字符串的编码
Python3直接支持Unicode,可以表示世界上任何书面语言的字符。Python3的字符默认就是16为编码的Unicode编码,ASCⅡ是Unicode编码的子集。所以一个汉字在Unicode编码中表示的长度是1。
使用内置函数ord()可以把字符转成对应Unicode码。
使用内置函数chr()可以把十进制数字转换成对应的字符。
引号创建字符串
我们可以通过单引号或双引号创建字符串。例如:
可以通过使用两种引号创建本身就包含引号顶点字符串,而不使用转义字符。例如:
连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如
空字符串和len()函数
Python允许空字符串的存在,不包含任何字符且长度为0。len()用于计算字符串含有多少字符。例如:
转义字符
我们可以使用"\+特殊字符",实现某些难以用字符表示的效果。例如:换行等。常见的的注意字符如下:
转义字符 | 描述 |
---|---|
\(在行尾时) | 续行符 |
\\ | 反斜杠符号 |
\' | 单引号 |
\* | 双引号 |
\b | 退格(Backspace) |
\n | 换行 |
\t | 横向制表符 |
\r | 回车 |
字符串拼接
1.可以使用+号将多个字符串拼接起来。例如:
(1)如果+两边都是字符串,则拼接
(2)如果+两边都是数字,则加法运算
(3)如果+两边类型不同,则抛出异常
2.可以将多个字符串直接放在一起拼接,例如:
注意:在字符串拼接中,+两边可以是字符串或变量,而直接放在一起拼接只能是字符串不能是变量。
字符串赋值
可以使用*实现字符串复制,可以复制字符串,也可以复制指向字符串的变量。 例如:
不换行打印
在前面调用print时,会自动打印一个换行符。有事,我们不想换行,不想自动添加换行符。我们可以自己通过参数end="任意字符串"。实现末位想添加任何内容:
在源文件中:
运行结果:
从控制台读取字符串
我们可以使用input()从控制台读取键盘输入的内容。在input()括号中的可以设置字符串,作为输入提示信息:
str()实现数字转型字符串
str()可以帮助我们将其他数据类型转换为字符串例如:
当我们调用print()函数是,解释器自动调用了str()将非字符对象转成了字符串。
使用[]提取字符串
字符串的本质是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取单个字符串。
正向搜索:
最左侧的第一字符,偏移量是0,第二个偏移量是1,一次类推。直到len(str)-1为止。
反向搜索:
最右侧第一字符,偏移量是-1.倒数第二个是-2,以此类推,直到-len(str)为止。
repalce()实现字符串替换
字符串是“不可改变“”的,我们可以通过[]可以获取字符串指定位置的字符,但我们不能改变字符串。我们尝试改变字符串中的某个字符串,发现报错了:
字符串不可改变。但是,我们的确有时候需要替换某些字符。这时,只能通过创建新的字符串来实现。
·
整个过程中,实际上我们是创建了新的字符串对象, 而变量a指向的字符串对象并没有改变。但如果将新的字符串对象指向变量a,变量a引用的对象发生了改变。内存图如下:
字符串切片slice操作
切片slice操作可以让我们快速的提取子字符串。标准格式为:
操作和说明 | 示例 | 结果 |
---|---|---|
[:] 提取整个字符串 | "abcdef"[:] | "abcdef" |
[start:]从头开始直到end-1 | "abcdef"[2:] | "cdef" |
[:end]从头开始直到end-1 | "abcdef"[:2] | "ab" |
[start:end]从start到end-1 | "abcdef"[2:4] | "cd" |
[start:end:step]从start提取到end-1,步长是step | "abcdef"[1:5:2] | "bd" |
其它操作(三个量为负数)的情况:
示例 | 说明 | 结果 |
---|---|---|
"abcdefghijklmnopqrstuvwxyz"[-3:]
| 倒数第三个 | "xyz" |
"abcdefghijklmnopqrstuvwxyz"[-8:-3] | 倒数第八个到倒数第三个(包头不包尾) | "stuvw" |
"abcdefghijklmnopqrstuvwxyz"[::-1] | 步长为负,从右到左反向提取 |
'zyxwvutsrqpon
mlkjihgfedcba'
|
切片操作时,起始偏移量和终止偏移量不在[0:字符串长度-1]这个范围,也不会报错。例如:
1.将"to be or not to be"字符串倒序输出
2.将"sxtsxtsxtsxtsxt"字符串中所有的 s 输出
split()分割和join()合并
split()可以基于指定分割符将字符分隔成多个子字符串(存储到列表中)。如果不指定分割符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下:
join()的作用和split()作用刚好相反,用于将一系列子字符串(列表)连接起来(字符串)。示例代码如下:
字符串拼接要点:
使用字符传拼接符+,会产生新的字符串对象,因此不推荐使用+来拼接字符串。推荐使用join函数,因为join函数在拼接字符串之前按会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。
测试+拼接符和join(),不同的效率:
运行结果:
字符串驻留机制和字符串比较
字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。Python支持字符串驻留机制,对于符合要要求的字符串(仅包含下划线(_)、字母、数字)会启用字符串驻留机制。
字符串驻留发生在compile_time,而不是run_time。
字符串比较和同一性
我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。
我们使用is/ not is,判断两个对象是否同一个对象。比较的是对象的地址,即id(obj1)是否和id(obj2)相等。
成员操作符号
in / not in 关键字,判断某个字符串(子字符串)是否存在与字符串中。
字符串常用方法
字符串有很多常用的方法,我们需要熟悉。
常用查找方法
以一段文本作为测试:
a='我叫彭XX,今年20,我在JXUST大学读书。我们没有女朋友,xdm都出去陪女朋友,而我只能敲代码,哇,为什么,同样是人,为什么我还要敲代码!算了,我还是得敲,老子好好学习,卷死它们,不说了,敲代码去了!'
方法和使用示例 | 说明 | 结果 |
---|---|---|
len(a) | 字符串长度 | 102 |
a.startswith('我叫彭XX') | 以指定字符串开头 | True |
a.endswith('敲代码去了!') | 以指定字符串结尾 | True |
a.find('彭') | 第一次出现指定字符串的位置 | 2 |
a.rfind('了') | 最后一次出现指定字符串的位置 | 100 |
a.count('为什么') | 指定字符串出现了几次 | 2 |
a.isalnum() | 所有字符全是字母或数字 | False |
去除首尾信息
我们可以通过strip()去除字符串首尾指定信息。通过lstrip()去除字符串左边指定信息,rstrio()去除字符串右边指定信息。
大小写转换
编程中关于字符串大小写转换的情况,经常遇见。相关方法汇总如下:
设定一个测试变量:
a="Phh is 'single'"
示例 | 说明 | 结果 |
---|---|---|
a.capitalize() | 产生新的字符串,首字母大写 | "Phh is 'single'" |
a.title() | 产生新的字符串,每个单词都首字母大写 | "Phh Is 'Single'" |
a.upper() | 产生新的字符串,所有字母全转成大写 | "PHH IS 'SINGLE'" |
a.lower() | 产生新的字符串,所有字符全转成小写 | "phh is 'single'" |
a.swapcase() | 产生新的字符串,所有字母大小写转换 | "pHH IS 'SINGLE'" |
格式排版
center()、ljust()、rjust()这三个函数用于对字符串实现排版。
其它方法
方法 | 说明 |
---|---|
isalnum() | 是否为字母或数字 |
isalpha() | 检测字符串是否只含字母(包括汉字) |
isdigit() | 检测字符串是否只由数字组成 |
isspace() | 检测是否为空字符串(或者说是否全为空格) |
issupper() | 是否为大写字母 |
islower() | 是否为小写字母 |
字符串的格式化
format()基本用法
Python2.6 开始,新增一种格式化字符串函数str.format(),它增强了字符串格式化的功能。
基本语法是通过{}和:来代替以前的%。
format()函数可以接受不限个参数,位置可以不按顺序。
参数格式:'{[index][:[fill] align][sign][#][width][.precision][type]} {……}{……} '.format()
以上参数的意义是:
注意,格式中的[ ]内的参数都是可选参数,可以使用也可以不使用。
index:指定冒号:后面除出现的参数在formart()中的索引值,如果没有,则按format()中的默认顺序分配。
fill:指定空白处的填充符号,默认为空白填充。
align:指定数字的对齐方式。
align参数 | 含义 |
---|---|
< | right-aligned 左对齐(对于大部分对象时为默认) |
> | right-aligned 右对齐 (对于数字时为默认) |
= | 数据右对齐,同时将符号放置在填充内容的最左侧,该选项只对数字类型有效 |
^ | 数据居中,此选项需和 width 参数一起使用 |
sign:指定有无符号数。
sign参数 | 含义 |
---|---|
+ | 正数前面添加 ‘ + ’ ,负数前面加 ‘ - ’ |
- | 正数前面不添加 ‘ + ’ ,负数前面加 ‘ - ’ |
space | 正数前面添加 ‘ 空格 ’ ,负数前面加 ‘ - ’ |
# | 对于二进制数、八进制数和十六进制数,使用此参数,各进制数前会分别显示 0b、0o、0x前缀;反之则不显示前缀 |
width:指定输出数据时所占的宽度
precision:如果后面存在type参数,则指的是保留小数的位数,
如果type参数不存在,则是指有效数字的位数
type:指定输出数据的具体类型
type参数 | 含义 |
---|---|
s | 对字符串类型格式化 |
d | 十进制整数 |
c | 将十进制整数转换成对应的Unicode字符 |
e or E | 转换成科学计数法后,再格式化输出 |
g or G | 指定在e和f或(E和F)中切换 |
b | 将十进制自动转换成二进制表示,再格式化输出 |
o | 将十进制自动转换成八进制表示,再格式化输出 |
x or X | 将十进制自动转换成十六进制表示,再格式化输出 |
f or F | 转换成浮点数(默认小数点后6为),再格式化输出 |
% | 显示白百分比(默认显示小数点后6位) |
可变字符串
在Python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智能创建新的字符串对象。但是,经常我们的确需要原地修改字符串,可以使用io.StringIO对象或array模块。
实操作业
1.从控制台输入用户的月薪,进行运算计算出年薪。打印输出用户的年薪
2.使用字符串复制,用计算机打印出“爱你一百遍”,打印 100 次
3.判断如下输出结果,并文字解释原因:
![](https://img-blog.csdnimg.cn/0498881721f04f8899f35bfabab0c845.png)
![](https://img-blog.csdnimg.cn/b8840b014c0b4a2f92a9c069e4e5314e.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5LmF6L-dZGXnuqblrpo=,size_9,color_FFFFFF,t_70,g_se,x_16)