如果对您有一丁点的帮助,劳烦动动手指点个赞,您的支持和鼓励是搬砖人不断创作的动力!
字符串基本特点.
很多人初学编程时,总是担心自己数学不行,潜意识里认为数学好才能编程。实际上,大多数程序员打交道最多的是“字符串”而不是“数字”。因为,编程是用来解决现实问题的,因此逻辑思维的重要性远远超过数学能力。
字符串的本质是:字符序列。Python的字符串是不可变的,我们无法对原字符串做任何修改。但可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。
Python不支持单字符类型,单字符也是作为一个字符串使用的。
字符串的编码
Python 3 直接支持Unicode,可以表示世界上任何书面语言的字符。Python 3 的字符默认就是 16 位Unicode编码,ASCII码是Unicode编码的子集。
使用内置函数ord()可以把字符转换成对应的Unicode码;
使用内置函数chr()可以把十进制数字转换成对应的字符。
>>>ord('A')
65
>>>ord('高')
39640
>>>chr( 66 )
'B'
>>>ord('淇')
28103
引号创建字符串
我们可以通过单引号或双引号创建字符串。例如:a=’abc’; b=”sxt”
使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。例如:
>>>a="I'mateacher!"
>>>print(a)
I'mateacher!
>>>b='my_nameis"TOM"'
>>>print(b)
my_nameis"TOM"
连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如:
>>>resume='''name="gaoqi"
company="sxt" age= 18
lover="Tom"'''
>>>print(resume)
name="gaoqi"
company="sxt" age= 18
lover="Tom"
空字符串和len()函数
Python允许空字符串的存在,不包含任何字符且长度为 0 。例如:
>>>c=''
>>>len(c)
0
len()用于计算字符串含有多少字符。例如:
>>>d='abcPython学堂'
>>>len(d)
6
转义字符
我们可以使用“+特殊字符”,实现某些难以用字符表示的效果。比如:换行等。常见的转义字符有这些:
转义字符 | 描述 |
---|---|
\ | (在行尾时) 续行符 |
\\ | 反斜杠符号 |
’ | 单引号 |
" | 双引号 |
\b | 退格(Backspace) |
\n | 换行 |
\t | 横向制表符 |
\r | 回车 |
【操作】测试转义字符的使用
>>>a='I\nlove\nU'
>>>a
'I\nlove\nU'
>>>print(a)
I
love
U
>>>print('aaabb\
cccddd')
aaabbcccddd
字符串拼接
1 .可以使用+将多个字符串拼接起来。例如:’aa’+’bb’ ==>’aabb’。
( 1 ) 如果+两边都是字符串,则拼接。
( 2 ) 如果+两边都是数字,则加法运算。
( 3 ) 如果+两边类型不同,则抛出异常。
2 .可以将多个字面字符串直接放到一起实现拼接。例如:’aa’’bb’==>’aabb’
【操作】字符串拼接操作
>>>a='sxt'+'gaoqi'
>>>a
'sxtgaoqi'
>>>b='sxt''gaoqi'
>>>b
'sxtgaoqi'
字符串复制
使用*可以实现字符串复制
【操作】字符串复制操作
>>>a='Sxt'* 3
>>>a
'SxtSxtSxt'
不换行打印
我们前面调用print时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行
符。我们可以自己通过参数end=“任意字符串”。实现末尾添加任何内容:
建立源文件mypy_ 06 .py:
print("sxt",end='')
print("sxt",end='##')
print("sxt")
运行结果:
sxtsxt##sxt
从控制台读取字符串
我们可以使用input()从控制台读取键盘输入的内容。
>>>myname=input("请输入名字:")
请输入名字:高老师
>>>myname
'高老师'
str()实现数字转型字符串
str()可以帮助我们将其他数据类型转换为字符串。例如:
str( 5. 20 )>‘ 5. 20 ’ str( 3. 14 e 2 )>’ 314. 0 ’ str(True)==>‘True’
当我们调用print()函数时,解释器自动调用了str()将非字符串的对象转成了字符串。我们
在面向对象章节中详细讲解这部分内容。
使用[]提取字符
字符串的本质就是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,
可以提取该位置的单个字符。
正向搜索:
最左侧第一个字符,偏移量是 0 ,第二个偏移量是 1 ,以此类推。直到len(str)- 1
为止。
反向搜索:
最右侧第一个字符,偏移量是- 1 ,倒数第二个偏移量是- 2 ,以此类推,直到-len(str)
为止。
【操作】使用[]提取字符串中的字符
>>>a='abcdefghijklmnopqrstuvwxyz'
>>>a
'abcdefghijklmnopqrstuvwxyz'
>>>a[ 0 ]
'a'
>>>a[ 3 ]
'd'
>>>a[ 26 - 1 ]
'z'
>>>a[- 1 ]
'z'
>>>a[- 26 ]
'a'
>>>a[- 30 ]
Traceback(mostrecentcalllast):
File"<pyshell# 91 >",line 1 ,in<module>
a[- 30 ]
IndexError:stringindexoutofrange
replace()实现字符串替换
字符串是“不可改变”的,我们通过[]可以获取字符串指定位置的字符,但是我们不能改变字符串。我们尝试改变字符串中某个字符,发现报错了:
>>>a='abcdefghijklmnopqrstuvwxyz'
>>>a
'abcdefghijklmnopqrstuvwxyz'
>>>a[ 3 ]='高'
Traceback(mostrecentcalllast):
File"<pyshell# 94 >",line 1 ,in<module>
a[ 3 ]='高'
TypeError:'str'objectdoesnotsupportitemassignment
字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符串来实现。
>>>a='abcdefghijklmnopqrstuvwxyz'
>>>a
'abcdefghijklmnopqrstuvwxyz'
>>>a=a.replace('c','高')
'ab高defghijklmnopqrstuvwxyz'
整个过程中,实际上我们是创建了新的字符串对象,并指向了变量a,而不是修改了以前的字符串。 内存图如下:
字符串切片slice操作
切片slice操作可以让我们快速的提取子字符串。标准格式为:
[起始偏移量start:终止偏移量end:步长step]
典型操作(三个量为正数的情况)如下:
操作和说明 | 示例 | 结果 |
---|---|---|
[:] 提取整个字符串 | “abcdef” [:] | “abcdef” |
[start:]从start索引开始到结尾 | “abcdef” [ 2 :] | “cdef” |
[:end]从头开始知道end- 1 | “abcdef” [: 2 ] | “ab” |
[start:end]从start到end- 1 | “abcdef” [ 2 : 4 ] | “cd” |
[start: end:step]从start提取到 end- 1 ,步长是step | “abcdef” [ 1 : 5 : 2 ] | “bd” |
其他操作(三个量为负数)的情况:
示例 | 说明 | 结果 |
---|---|---|
“abcdefghijklmnopqrstuvwxyz” [- 3 :] | 倒数三个 “xyz” | “xyz” |
“abcdefghijklmnopqrstuvwxyz”[- 8 :- 3 ] | 倒数第八个到倒数第三个(包头不包尾) | ‘stuvw’ |
“abcdefghijklmnopqrstuvwxyz”[::- 1 ] | 步长为负,从右到左 | ‘zyxwvutsrqponmlkjihgfedcba’ |
切片操作时,起始偏移量和终止偏移量不在[ 0 ,字符串长度- 1 ]这个范围,也不会报错。起始
偏移量小于 0 则会当做 0 ,终止偏移量大于“长度- 1 ”会被当成- 1 。例如:
>>>"abcdefg"[ 3 : 50 ]
'defg'
我们发现正常输出了结果,没有报错。
【操作】
1 .将”tobeornottobe”字符串倒序输出
2 .将”sxtsxtsxtsxtsxt”字符串中所有的s输出
split()分割和join()合并
split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔
符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下:
>>>a="tobeornottobe"
>>>a.split()
['to','be','or','not','to','be']
>>>a.split('be')
['to','ornotto','']
join()的作用和split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:
>>>a=['sxt','sxt 100 ','sxt 200 ']
>>>'*'.join(a)
'sxt*sxt 100 *sxt 200 '
拼接字符串要点:
使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。推荐
使用join函数,因为join函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,
仅新建一次对象。
【操作】测试+拼接符和join(),不同的效率(mypy_ 07 .py)
importtime
time 01 =time.time() #起始时刻
a=""
for i in range( 1000000 ):
a+="sxt"
time 02 =time.time() #终止时刻
print("运算时间:"+str(time 02 - time 01 ))
time 03 =time.time() #起始时刻
li=[]
for i in range( 1000000 ):
li.append("sxt")
a="".join(li)
time 04 =time.time() #终止时刻
print("运算时间:"+str(time 04 - time 03 ))
字符串驻留机制和字符串比较
字符串驻留: 仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。
Python支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母
和数字)会启用字符串驻留机制驻留机制。
>>>a="abd_ 33 "
>>>b="abd_ 33 "
>>>aisb
True
>>>c="dd#"
>>>d="dd#"
>>>cisd
False
>>>str 1 ="aa"
>>>str 2 ="bb"
>>>str 1 +str 2 is"aabb"
>False
>>>str 1 +str 2 =="aabb"
True
字符串比较和同一性
我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。
我们使用is/notis,判断两个对象是否同一个对象。比较的是对象的地址,即id(obj 1 )是
否和id(obj 2 )相等。
成员操作符
in/notin关键字,判断某个字符(子字符串)是否存在于字符串中。
字符串常用方法汇总
字符串有很多常用的方法,我们需要熟悉。我们通过表格将这些方法汇总起来,方便大家查
阅。希望大家针对每个方法都做一次测试。
常用查找方法
我们以一段文本作为测试:
a=‘’‘我是高老师,今年 38 岁了。我的儿子叫高小明,他 6 岁了。我
是一个编程教育的普及者,希望影响 6000 万学习编程的中国人。我儿子现在也开始学习编
程,希望他 28 岁的时候可以超过我’‘’
方法和使用示例 | 说明 | 结果 |
---|---|---|
len(a) | 字符串长度 | 96 |
a.startswith(‘我是高老师’) | 以指定字符串开头 | True |
a.endswith(‘过我’) | 以指定字符串结尾 | True |
a.find(‘高’) | 第一次出现指定字符串的位置 | 2 |
a.rfind(‘高’) | 最后一次出现指定字符串的位置 | 29 |
a.count(“编程”) | 指定字符串出现了几次 | 3 |
a.isalnum() | 所有字符全是字母或数字 | False |
去除首尾信息
我们可以通过strip()去除字符串首尾指定信息。通过lstrip()去除字符串左边指定信息,
rstrip()去除字符串右边指定信息。
【操作】去除字符串首尾信息
>>>"*s*x*t*".strip("*")
's*x*t'
>>>"*s*x*t*".lstrip("*")
's*x*t*'
>>>"*s*x*t*".rstrip("*")
'*s*x*t'
>>>" sxt ".strip()
'sxt'
大小写转换
编程中关于字符串大小写转换的情况,经常遇到。我们将相关方法汇总到这里。为了方便学
习,先设定一个测试变量:
a=“gaoqi love programming,love SXT”
示例 | 说明 | 结果 |
---|---|---|
a.capitalize() 大写 | 产生新的字符串,首字母 | ‘Gaoqi love programming, love sxt’ |
a.title() | 产生新的字符串,每个单词都首字母大写 | ‘Gaoqi Love Programming, Love Sxt’ |
a.upper() | 产生新的字符串,所有字符全转成大写 | ‘GAOQI LOVE PROGRAMMING, LOVE SXT’ |
a.lower() | 产生新的字符串,所有字符全转成小写 | ‘gaoqi love programming, love sxt’ |
a.swapcase() | 产生新的,所有字母大小写转换 | ‘GAOQI LOVE PROGRAMMING, LOVE sxt’ |
格式排版
center()、ljust()、rjust()这三个函数用于对字符串实现排版。示例如下:
>>>a="SXT"
>>>a.center( 10 ,"*")
'***SXT****'
>>>a.center( 10 )
' SXT '
>>>a.ljust( 10 ,"*")
'SXT*******'
其他方法
1 .isalnum()是否为字母或数字
2 .isalpha() 检测字符串是否只由字母组成(含汉字)。
3 .isdigit() 检测字符串是否只由数字组成。
4 .isspace() 检测是否为空白符
5 .isupper()是否为大写字母
6 .islower() 是否为小写字母
>>>"sxt 100 ".isalnum()
True
>>>"sxtPython学堂".isalpha()
True
>>>" 234. 3 ".isdigit()
False
>>>" 23423 ".isdigit()
True
>>>"aB".isupper()
False
>>>"A".isupper()
True
>>>"\t\n".isspace()
True
字符串的格式化
format()基本用法
Python 2. 6 开始,新增了一种格式化字符串的函数str.format(),它增强了字符串格式化的
功能。
基本语法是通过{}和:来代替以前的%。
format函数可以接受不限个参数,位置可以不按顺序。
我们通过示例进行格式化的学习。
>>>a="名字是:{ 0 },年龄是:{ 1 }"
>>>a.format("高老师", 18 )
'名字是:高老师,年龄是: 18 '
>>>a.format("高希希", 6 )
'名字是:高希希,年龄是: 6 '
>>>b="名字是:{ 0 },年龄是{ 1 }。{ 0 }是个好小伙"
>>>b.format("高老师", 18 )
'名字是:高老师,年龄是 18 。高老师是个好小伙'
>>>c="名字是{name},年龄是{age}"
>>>c.format(age= 19 ,name='高老师')
'名字是高老师,年龄是 19 '
我们可以通过{索引}/{参数名},直接映射参数值,实现对字符串的格式化,非常方便。
填充与对齐
填充常跟对齐一起使用
^、<、>分别是居中、左对齐、右对齐,后面带宽度
:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充
>>>"{:*> 8 }".format(" 245 ")
'***** 245 '
>>>"我是{ 0 },我喜欢数字{ 1 :*^ 8 }".format("高老师"," 666 ")
‘我是高老师,我喜欢数字** 666 ***’
数字格式化
浮点数通过f,整数通过d进行需要的格式化。案例如下:
>>>a="我是{ 0 },我的存款有{ 1 :. 2 f}"
>>>a.format("高老师", 3888. 234342 )
'我是高老师,我的存款有 3888. 23 '
其他格式,供大家参考:
数字 | 格式 | 输出 | 描述 |
---|---|---|---|
3. 1415926 | {:. 2 f} | 3. 14 | 保留小数点后两位 |
3. 1415926 | {:+. 2 f} | 3. 14 | 带符号保留小数点后两位 |
2. 71828 | {:. 0 f} | 3 | 不带小数 |
5 | {: 0 > 2 d} | 05 | 数字补零(填充左边,宽度为 2 ) |
5 | {:x< 4 d} | 5 xxx | 数字补x(填充右边,宽度为 4 ) |
10 | {:x< 4 d} | 10 | xx 数字补x(填充右边,宽度为 4 ) |
1000000 | {:,} | 1 , 000 , 000 | 以逗号分隔的数字格式 |
0. 25 | {:. 2 %} | 25. 00 % | 百分比格式 |
1000000000 | {:. 2 e} | 1. 00 E+ 09 | 指数记法 |
13 | {: 10 d} | 13 | 右对齐(默认,宽度为 10 ) |
13 | {:< 10 d} | 13 | 左对齐(宽度为 10 ) |
13 | {:^ 10 d} | 13 | 中间对齐(宽度为 10 ) |
可变字符串
在Python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智
能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用io.StringIO
对象或array模块。
>>>importio
>>>s="hello,sxt"
>>>sio=io.StringIO(s)
>>>sio
<_io.StringIOobjectat 0 x 02 F 462 B 0 >
>>>sio.getvalue()
'hello,sxt'
>>>sio.seek( 7 )
7
>>>sio.write("g")
1
>>>sio.getvalue()
'hello,gxt'
欢迎扫描微信添加,技术交流+资源分享
ID: Txtechcom