Python基础学习-第四天
字符串基本特点
- Python 的字符串是不可变的
- Python3 直接支持 Unicode,可以表示世界上任何书面语言的字符。Python3 的字符 默认就是 16 位 Unicode编码,ASCII 码是 Unicode 编码的子集。
- 使用内置函数 ord() 可以把字符转换成对应的 Unicode 码;
- 使用内置函数 chr() 可以把十进制数字转换成对应的字符
>>> ord('A')
65
>>> ord('程')
31243
>>> chr('66')
Traceback (most recent call last):
File "<pyshell#3>", line 1, in <module>
chr('66')
TypeError: an integer is required (got type str)
>>> chr(66) #不需要引号
'B'
引号创建字符串
我们可以通过单引号或双引号创建字符串。例如:a=’abc’; b=”sxt”
>>> a = "I'm a teacher!" #双引号开始,双引号结束,中间的单引号不影响
>>> print(a)
连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如:
>>> resume = ''' name="gaoqi"
company="sxt" age=18
lover="Tom"'''
>>> print(resume)
name="gaoqi"
company="sxt" age=18
lover="Tom"
空字符串和 len()函数
Python 允许空字符串的存在,不包含任何字符且长度为 0。例如:
>>> c = ''
>>> len(c)
0
转义字符
>>> a='i\'love\nu'
>>> a
"i'love\nu"
>>> print(a)
i'love
U
字符串拼接
>>> a = 'sxt'+'gaoqi'
>>> a
'sxtgaoqi'
>>> b = 'sxt''gaoqi'
>>> b
'sxtgaoqi'
字符串复制
>>> a = 'Sxt'*3
>>> a
'SxtSxtSxt'
不换行打印
print("aa",end="\n")
print("bb",end="\t")
print("cc")
运行结果:
aa
bb cc
>>>
从控制台读取字符串
使用 input() 从控制台读取键盘输入的内容。
>>> myname = input("请输入名字:")
请输入名字:水水水水
>>> myname
'水水水水'
>>>
str()实现数字转型字符串
>>> int("234")
234
>>> str(3.14e2)
'314.0'
>>> str(True)
'True'
>>> str(5.20)
'5.2'
>>>
使用[]提取字符
>>> a = 'abcdefghijklmnopqrstuvwxyz'
>>> a
'abcdefghijklmnopqrstuvwxyz'
>>> a[0]
'a'
>>> a[3]
'd'
>>> a[-1]
'z'
replace()实现字符串替换
>>> a = 'abcdefghijklmnopqrstuvwxyz'
>>> a
'abcdefghijklmnopqrstuvwxyz'
>>> a[3]='高'
Traceback (most recent call last):
File "<pyshell#12>", line 1, in <module>
a[3]='高'
TypeError: 'str' object does not support item assignment
>>> a=a.replace('c','高')
>>> a
'ab高defghijklmnopqrstuvwxyz'
>>>
- 字符串是“不可改变”的
- 我们是创建了新的字符串对象,并指向了变量 a,而不是修改了以前的字符串
字符串切片 slice 操作
-
切片 slice 操作可以让我们快速的提取子字符串。
-
标准格式为:
[起始偏移量 start:终止偏移量 end:步长 step]
>>> "to be or not to be"[::-1]
'eb ot ton ro eb ot'
>>> "sxtsxtsxtsxtsxt"[::3]
'sssss'
split()分割和 join()合并
>>> a = "to be or not to be"
>>> a.split()
['to', 'be', 'or', 'not', 'to', 'be']
>>> a.split("to")
['', ' be or not ', ' be']
>>> a =['to', 'be', 'or', 'not', 'to', 'be']
>>> ' '.join(a)
'to be or not to be'
- 拼接字符串要点:
- 使用字符串拼接符 + ,会生成新的字符串对象,因此不推荐使用+来拼接字符串。
- 推荐使用 join 函数,因为 join 函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。
测试+拼接符和 join(),不同的效率
import time
time01 = time.time() #起始时刻
a =""
for i in range(1000000):
a +="sxt"
time02 = time.time() #终止时刻
print("运算时间:"+ str(time02-time01))
time03 = time.time() #起始时刻
li = []
for i in range(1000000):
li.append("sxt")
a = "".join(li)
time04 = time.time() #终止时刻
print("运算时间:"+ str(time04-time03))
运行结果:
运算时间:1.0707454681396484
运算时间:0.18503880500793457
字符串驻留机制和字符串比较
- 字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。
- Python 支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母和数字)会启用字符串驻留机制驻留机制。
- 我们可以直接使用 ==, != 对字符串进行比较,是否含有相同的字符。
- 我们使用 is / not is,判断两个对象是否同一个对象。比较的是对象的地址,即 id(obj1)是否和 id(obj2)相等。
>>> a = "abc_3"
>>> b = "abc_3"
>>> a is b
True
>>> c ="dd#" #井号不符合字符串
>>> d ="dd#"
>>> c is d
False
>>> c ==d #值相同
True
>>> str1 = "aa"
>>> str2 = "bb"
>>> str1+str2 is "aabb"
False
>>> str1+str2 =="aabb"
True
>>>
>>> a ="wpbcdef"
>>> "bcd" in a
True
>>> "wb" in a
False
>>>
字符串常用方法
>>> a='''我是高起,今年19岁了,我在上海大学堂科技上班。我的哥哥叫高希仁,他6岁了。我是一个编程教育的普及者,希望影响6000万学习编程的中国人。我哥哥现在也开始学习编程,希望他19岁的时候可以超过我'''
>>> len(a)
96
>>> a.startswith("我是")
True
>>> a.endswith("过我")
True
>>> a.find("高")
2
>>> a.rfind("高")
29
>>> a.count("编程")
3
>>> a.isalnum()
False
>>>
去除首尾信息
-strip( ) 去除字符串首尾指定信息
-lstrip() 去除字符串左边指定信息
-rstrip() 去除字符串右边指定信息
>>> " sxt ".strip()
'sxt'
>>> "*s*x*t*".strip("*")
's*x*t'
>>> "##sxt".lstrip("#")
'sxt'
>>>
大小写转换
>>> a = "gaoqi love programming, love SXT"
>>> a.capitalize()
'Gaoqi love programming, love sxt'
>>> a.title()
'Gaoqi Love Programming, Love Sxt'
>>> a.upper()
'GAOQI LOVE PROGRAMMING, LOVE SXT'
>>> a.lower()
'gaoqi love programming, love sxt'
>>> a.swapcase()
'GAOQI LOVE PROGRAMMING, LOVE sxt'
>>>
格式排版
center()、ljust()、rjust() 这三个函数用于对字符串实现排版
>>> a= "SXT"
>>> a.center(10)
' SXT '
>>> a.center(10,"*")
'***SXT****'
>>> a.ljust(10,"*")
'SXT*******'
>>> a.rjust(10,"*")
'*******SXT'
>>>
其他方法
- isalnum() 是否为字母或数字
- isalpha() 检测字符串是否只由字母组成(含汉字)。
- isdigit() 检测字符串是否只由数字组成。
- isspace() 检测是否为空白符
- isupper() 是否为大写字母
- islower() 是否为小写字母
>>> "sxt100".isalnum()
True
>>> "sxt商突然"。isalpha()
SyntaxError: invalid character '。' (U+3002)
>>> "vsdvsdv是的武器哦".isalpha()
True
>>> "232323".isdigit()
True
>>> "A".isupper()
True
>>> "\t\n".isspace()
True
>>>
字符串的格式化
format()基本用法
>>> a= "名字是:{0},年龄是:{1}"
>>> a.format("哈哈",19)
'名字是:哈哈,年龄是:19'
>>> b = "名字是:{0},年龄是{1}。{0}是个好小伙"
>>> b.format("哈哈",19)
'名字是:哈哈,年龄是19。哈哈是个好小伙'
>>> c = "名字是{name},年龄是{age}"
>>> c.format(age=19,name='哈哈')
'名字是哈哈,年龄是19'
>>>
填充与对齐
- 填充常跟对齐一起使用
- ^、<、>分别是居中、左对齐、右对齐,后面带宽度
- : 号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充
>>> "{:*>8}".format("34234")
'***34234'
>>> "我是{0},我喜欢数字{1:*^8}".format("哈哈",19)
'我是哈哈,我喜欢数字***19***'
>>>
数字格式化
>>> a = "我是{0},我的存款有{1:.2f}"
>>> a.format("四海",399.99)
'我是四海,我的存款有399.99'
>>> "{:.0f}".format(2.54)
'3'
>>> {:,}.format(1000000)
SyntaxError: invalid syntax
>>> "{:,}".format(100000000)
'100,000,000'
>>>
可变字符串
- 在 Python 中,字符串属于不可变对象,不支持原地修改
- 如果需要修改其中的值,智能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用 io.StringIO对象或 array
模块。
import io
s = "hello,sxt"
sio = io.StringIO(s)
运行结果:
>>> sio
<_io.StringIO object at 0x000002CC54CEBAF0>
>>> sio.getvalue()
'hello,sxt'
>>> sio.seek(7)
7
>>> sio.write("g")
1
>>> sio.getvalue()
'hello,sgt'
>>>