第二节 Python字符串

一、链式赋值_系列解包赋值_常量

1、链式赋值

链式赋值用于同一个对象赋值给多个变量。

x=y=123

相当于:

x=123;y=123

2、系列解包赋值

系列数据赋值给对应相同个数的变量(个数必须保持一致)

>>> a,b,c=4,5,6

相当于:

a=4;b=5;c=6

【操作】使用系列解包赋值实现变量交换

>>>a,b = 1,2
>>>a,b = b,a
>>>print(a,b)

3、常量

Python不支持常量,即没有语法规则限制改变一个常量的值。我们只能约定常量的命名规则,以及在程序的逻辑上不对常量的值作出修改。

>>> MAX_SPEED = 120
>>> print(MAX_SPEED)120

Python不支持常量,即没有语法规则限制改变一个常量的值。我们只能约定常量的命名规则,以及在程序的逻辑上不对常量的值作出修改。

>>>MAX_SPEED = 120
>>>print(MAX_SPEED)120
>>>MAX_SPEED = 140		#实际是可以改的。只能逻辑上不做修改。
>>>print(MAX_SPEED)
140

二、内置数据类型_基本算术运算符

1、最基本内置数据类型介绍

每个对象都有类型,python中最基本的内置数据类型∶

  1. 整型
    整数,2345,10,50

  2. 浮点型
    小数,3.14或者科学计数法314e-2

  3. 布尔型
    表示真假,仅包含:True、False

  4. 字符串型
    由字符组成的序列。“abc” " sxt”

2、数字

Python支持整数(如∶50,520)和浮点数(如∶3.14,10.0,1.23e2),我们可以对数字做如下运算。

运算符说明示例结果
+加法3+25
-减法30-525
*乘法3*618
/浮点数除法8/24.0
//整数除法7/23
%模(取余)7%43
**2**38

【操作】基本运算符的使用
除数为0,会产生异常:

>>> 5/0
Traceback (most recent call last):
  File "<pyshell#0>", line 1, in <module>
    5/0
ZeroDivisionError: division by zero

使用divmod()函数同时得到商和余数:

>>>divmod(13,3)
(4,1)

divmod()是一个函数,我们以后会详细介绍。它返回的是一个元组(后续将会学习)。

三、整数_不同进制_其他类型转换成整数

1、整数

Python中,除10进制,还有其他三种进制:
5. 0b 或 0B,二进制     0 1
6. 0o 或 0O,八进制     0 1 2 3 4 5 6 7
7. 0x 或 0X,十六进制   0 1 2 3 4 5 6 7 8 9 a b c d e f

这三种进制可以非常方便的进行“位运算”操作。位运算知识后续将会介绍。
【操作】测试不同进制

>>> 12
12
>>> 0b101
5
>>> 0o19
SyntaxError: invalid digit '9' in octal literal
>>> 0o10
8
>>> 0xff
255
>>> 0xf
15
>>> 0x10
16

使用int()实现类型转换

  1. 浮点数直接舍去小数部分。如:int(9.9)结果是:9
>>> int(9.9)
9
  1. 布尔值True转为1,False转为0。如:int(True)结果是1
>>> int(True)
1
  1. 字符串符合整数格式(浮点数格式不行)则直接转成对应整数,否则报错。
>>> int("456")
456
>>> int("456abc")
Traceback (most recent call last):
 File "<pyshell#12>", line 1, in <module>
   int("456abc")
ValueError: invalid literal for int() with base 10: '456abc'
>>> int("456.78")
Traceback (most recent call last):
 File "<pyshell#13>", line 1, in <module>
   int("456.78")
ValueError: invalid literal for int() with base 10: '456.78'

自动转型:
 整数和浮点数混合运算时,表达式结果自动转型成浮点数。比如:2+8.0的结果是10.0

>>> 2+8.0
10.0

整数可以有多大?
 Python2中,int是32位,可以存储从-2147483648到2147483647的整数(约±21亿)。Long类型是64位,可以存储:-263–263-1之间的数值。
 Python3中,int可以存储任意大小的整数,long被取消。我们甚至可以存储下面的值:

>>> googol = 10**100
>>> googol
10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

 Googol也是Google最初的名字,这也是Google最初的含义。
 Python3中可以做超大数的计算,而不会造成“整数溢出”,这也是Python特别适合科学运算的特点。

浮点数_自动转换_强制转换_增强赋值运算符

浮点数

浮点数,称为float。
浮点数用 a × b 10 a\times b^{10} a×b10形式的科学计数法表示。比如:3.14,表示成:314E-2或者314e-2。
这些数字在内存中也是按照科学计算法存储。

类型转换和四舍五入

  1. 类似于int(),我们也可以使用float()将其他类型转换成浮点数。
  2. 整数和浮点数混合运算时,表达式结果自动转型成浮点数。比如:2+8.0的结果是10.0
  3. round(balue) 可以返回四舍五入的值
     注:但不会改变原有值,而是产生新的值

增强型赋值运算符

运算符+、-、*、/、//、**和%的赋值符=结合可以构成“增强型赋值运算符”。
a=a+1   等价于:  a+=1

增强型赋值运算符
运算符例子等价
+=a+=2a=a+2
-=a-=2a=a-2
*=a*=2a=a*2
/=a/=2a=a/2
//=a//=2a=a//2
**=a**=2a=a**2
%=a%=2a=a%2

注意:“+=” 中间不能加空格!

时间表示_unix时间点_毫秒和微秒_time模块

时间的表示

  计算机中时间的表示是从“1970年1月1日00:00:00”开始,以毫秒(1/1000秒)进行计算。我们也把1970年这个时刻称为“unix时间点”。

unix时间点
 python中可以通过time.time()获得当前时刻,返回的值是以秒为单位,带微秒(1/1000毫秒)精度的浮点值。例如:1608881686.3247402

>>> import time
>>> time.time()
1608881658.317696
>>> time.time()
1608881686.3247402
>>> b = int(time.time())
>>> b
1608881799
>>> totalMinutes = b/60
>>> totalMinutes
26814696.65
>>> totalMinutes = b//60
>>> totalMinutes
26814696
>>> totalHours = totalMinutes//60
>>> totalHours
446911
>>> totalDays = totalHours//24
>>> totalDays
18621
>>> totalYears = totalDays//365
>>> totalYears
51

【操作】定义多点坐标_绘出折线_并计算起始点和重点距离

import turtle
import math

# 定义多个点的坐标
x1, y1 = 100, 100
x2, y2 = 100, -100
x3, y3 = -100, -100
x4, y4 = -100, 100

# 绘制折线
turtle.penup()
turtle.goto(x1, y1)
turtle.pendown()

turtle.goto(x2, y2)
turtle.goto(x3, y3)
turtle.goto(x4, y4)

# 计算起始点和终点的距离
distance = math.sqrt((x1 - x4)**2 + (y1-y4)**2)
turtle.write(distance)

运行结果:
绘制折线计算距离

布尔值_比较运算符_逻辑运算符_短路问题

布尔值

Python2中没有布尔值,直接用数字0表示False,用数字1表示True。
Python3中,把True和False定义成了关键字,但他们的本质还是1和0,甚至可以和数字相加。

>>> a = True
>>> b = 3
>>> a+b
4

比较运算符

所有比较运算符返回1表示真,返回0表示假。这分别与特殊的变量True和False等价。
以下假设变量a为15,变量b为30:

运算符描述实例
==等于 — 比较对象的值是否相等(a == b) 返回 False
!=不等于 — 比较两个对象的值是否不相等(a != b) 返回 True
>大于 — 返回 x 是否大于 y(a > b) 返回False
<小于 — 返回 x 是否小于 y(a < b) 返回True
>=大于等于 — 返回 x 是否大于等于y(a >= b) 返回 False
<=小于等于 — 返回 x 是否小于等于y(a <= b) 返回 True

逻辑运算符

运算符格式说明
or
逻辑或
x or yx 为 True,则不计算 y,直接返回 True
x 为 False,则返回 y
and
逻辑与
x and yx 为 True,则返回 y 的值
x 为 False,则不计算 y,直接返回 False
not
逻辑非
not xx 为 True,则返回 False
x 为 False,则返回 True

同一运算符_整数缓存问题

同一运算符

同一运算符用于比较两个对象的存储单元,实际比较的是对象的地址。

运算符描述
isis 是判断两个标识符是不是引用同一个对象
is notis not 是判断两个标识符是不是引用不同对象

is 与 == 区别:
    is 用于判断两个变量引用对象是否为同一个,既比较对象的地址。
   == 用于判断引用变量引用对象的值是否相等,默认调用对象的__eq__()方法。

>>> a = 1000
>>> b = 1000
>>> a == b
True
>>> a is b
False

整数缓存问题

  Python 仅仅对Python仅仅对比较小的整数对象进行缓存(范围为[-5,256])缓存起来,而并非是所有整数对象。需要注意的是,这仅仅是在命令行中执行,而在Pycharm或者保存为文件执行,结果是不一样的,这是因为解释器做了一部分优化(范围是[-5,任意正整数])。

>>> c = 10
>>> d = 10
>>> c is d
True
>>> id(c)
2727843621456
>>> id(d)
2727843621456

总结

  1. is 比较两个对象的id值是否相等,是否指向同一个内存地址;
  2. ==比较的是两个对象的内容是否相等,值是否相等;
  3. 小整数对象[-5,256]在全局解释器范围内被放入缓存供重复使用;
  4. is运算符比==效率高,在变量和None进行比较时,应该使用is。

字符串_unicode字符集_三种创建字符串方式_len()

字符串基本特点

  很多人初学编程时,总是担心自己数学不行,潜意识里认为数学好才能编程。实际上,大多数程序员打交道最多的是“字符串”而不是“数字”。因为,编程是用来解决现实问题的,因此逻辑思维的重要性远远超过数学能力。
  字符串的本质是∶字符序列。Python 的字符串是不可变的,我们无法对原字符串做任何修改。但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。
  Python不支持单字符类型,单字符也是作为一个字符串使用的。

字符串的编码

  Python3直接支持Unicode,可以表示世界上任何书面语言的字符。Python3的字符默认就是16位Unicode编码,ASCII码是Unicode编码的子集。
  使用内置函数ord()可以把字符转换成对应的Unicode码;
  使用内置函数chr)可以把十进制数字转换成对应的字符。

>>> ord('A')
65
>>> ord('你')
20320
>>> chr(66)
'B'
>>> ord('好')
22909

引号创建字符串

我们可以通过单引号或双引号创建字符串。例如:a=’ abc’ ; b=” sxt"
使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。例如∶

>>> a = "sxt"
>>> print(a)
sxt
>>> a = 'sxt'
>>> a
'sxt'
>>> a = "I'm a teacher!"
>>> print(a)
I'm a teacher!
>>> b = 'my_name is "Tom"'
>>> print(b)
my_name is "Tom"

连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如︰

>>> resume = ''' name = "gaoqi"
company = "six"  age = 18
lover = "Tom"'''
>>> print(resume)
 name = "gaoqi"
company = "six"  age = 18
lover = "Tom"

空字符串和len()函数

Python允许空字符串的存在,不包含任何字符且长度为0。例如︰

>>> c = ''
>>> len(c)
0

len()用于计算字符串含有多少字符。例如:

>>> d = 'abc'
>>> len(d)
3

转义字符_字符串拼接_字符串复制_input()获得键盘输入

字符串基本特点

我们可以使用“+特殊字符”,实现某些难以用字符表示的效果。比如∶换行等。常见的转义字符有这些:

转义字符描述
(在行尾时)续行符
\反斜杠符号
\’单引号
\"双引号
\b退格(Backspace)
\n换行
\t横向制表符
\r回车

【操作】测试转义字符的使用

>>> a = 'I\nlove\nU'
>>> a
'I\nlove\nU'
>>> print(a)
I
love
U
>>> print('aaabb\
cccddd')
aaabbcccddd

【操作】使用原始字符串输出的技巧

>>> c = 'C:\aa\bb.mp4'
>>> c
'C:\x07a\x08b.mp4'
>>> c = '\c:\\aa\\bb.mp4'
>>> c
'\\c:\\aa\\bb.mp4'
>>> c = r'c:\aa\bb.mp4'
>>> c
'c:\\aa\\bb.mp4'

字符串拼接

  1. 可以使用+将多个字符串拼接起来。例如:’ aa’+ ’ bb’==>’ aabb’ 。
    (1)如果+两边都是字符串,则拼接。
    (2)如果+两边都是数字,则加法运算。
    (3)如果+两边类型不同,则抛出异常。
  2. 可以将多个字面字符串直接放到一起实现拼接。例如:’ aa’ ’ bb’==>’ aabb’

【操作】字符串拼接操作

>>> a = 'sxt' + 'gaoqi'
>>> a
'sxtgaoqi'
>>> b = 'sxt''gaoqi'
>>> b
'sxtgaoqi'
>>> 

字符串复制

使用*可以实现字符串复制。

【操作】字符串复制操作

>>> a = 'sxt'*3
>>> a
'sxtsxtsxt'
>>> 

不换行打印

我们前面调用print时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行符。我们可以自己通过参数end =“任意字符串”。实现末尾添加任何内容︰
建立源文件mypy_06.py :

print("sxt", end=' ')
print("sxt", end='##')
print("sxt")

运行结果︰
sxt sxt##sxt

从控制台读取字符串

我们可以使用input()从控制台读取键盘输入的内容。

>>> myname = input("请输入名字:")
请输入名字:张三
>>> myname
'张三'

str()_提取字符_replace()替换_替换_内存分析

str()实现数字转换字符串

str(可以帮助我们将其他数据类型转换为字符串。例如∶
str(5.20)==> ‘5.20’
str(3.14e2)==>‘314.0’
str(True) ==>‘True’

当我们调用print()函数时,解释器自动调用了str)将非字符串的对象转成了字符串。我们在面向对象章节中详细讲解这部分内容。

使用[]提取字符

  空符串的太质就是字符序列,我们可以通过在字符串后面添加,在]里面指定偏移量,可以提取该位置的单个字符。
  正向搜索︰
    最左侧第一个字符,偏移量是0,第二个偏移量是1,以此类推。直到len(str)-1为止。
  反向搜索︰
    最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2 ,以此类推,直到-len(str)为止。
【操作】使用[ ]提取字符串中的字符

>>> a = 'abcdefghijklmnopqretuvwxyz'
>>> a
'abcdefghijklmnopqretuvwxyz'
>>> a[0]
'a'
>>> a[3]
'd'
>>> a[26-1]
'z'
>>> a[-1]
'z'
>>> a[-30]
Traceback (most recent call last):
  File "<pyshell#71>", line 1, in <module>
    a[-30]
IndexError: string index out of range

切片slice操作_逆序

字符串切片slice操作

切片slice操作可以让我们快速的提取子字符串。标准格式为∶
  [起始偏移量start :终止偏移量end :步长step]
典型操作(三个量为正数的情况)如下:

操作和说明示例结果
[:] 提取整个字符串“abcdef” [:]“abcdef”
[start:] 从 start 索引开始到结尾“abcdef” [2:]"cdef
[:end] 从开头开始直到 end-1“abcdef” [:2]“ab”
[start:end] 从 start 到 end -1“abcdef” [2:4]“cd”
[start: end:step] 从 start 提取到 end-1,步长是 step“abcdef” [1:5:2]“bd”

其他操作(三个量为负数)的情况:

示例说明结果
“abcdefghijklmnopqretuvwxyz” [-3:]倒数三个“xyz”
“abcdefghijklmnopqretuvwxyz” [-8:-3]倒数第八个到倒数第三个
(包头不包尾)
“stuvw”
“abcdefghijklmnopqretuvwxyz” [::-1]步长为负,从右到左反向提取“zyxwvutsrqponmlkjihgfedcba”

切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于0则会当做0,终止偏移量大于“长度-1”会被当成-1。例如︰

>>> "abcdefg" [3:50]
'defg'

我们发现正常输出了结果,没有报错。
【操作】
1.将”to be or not to be”字符串倒序输出

>>> "to be or not to be" [::-1]
'eb ot ton ro eb ot'

2.将”sxtsxtsxtsxtsxt”字符串中所有的s输出

>>> "sxtsxtsxtsxtsxt" [::3]
'sssss'

Split()分割_Join()合并_join()效率测试

split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下∶

>>> a = "to be or not to be"
>>> a.split()
['to', 'be', 'or', 'not', 'to', 'be']
>>> a.split('be')
['to ', ' or not to ', '']

join)的作用和split()作用刚好相反,用于将一系列子字符串连接起来。示例代码如下:

>>> a = ['sxt','sxt100','sxt200']
>>> '*'.join(a)
'sxt*sxt100*sxt200'

拼接字符串重点:

  使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。推荐使用join函数,因为join函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝仅新建一次对象。
【操作】测试+拼接字符串和join(),不同的效率

import time

a = ""
time01 = time.time()    # 起始时刻
for i in range(1000000):
    a += "sxt"

time02 = time.time()    # 终止时刻

print("运算时间:" +str(time02-time01))

time03 = time.time()    # 起始时刻
li = []
for i in range(1000000):
    li.append("sxt")

a = "".join(li)
time04 = time.time()    # 终止时刻
print("运算时间:"+str(time04-time03))

运行结果:
运算时间:0.4905238151550293
运算时间:0.08295989036560059

驻留机制_内存分析_字符串同一判断_值相等判断

字符串驻留机制和字符串比较

字符串驻留: 仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。
Python支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母和数字)会启用字符串驻留机制驻留机制。

>>> a = "abc_33"
>>> b = "abc_33"
>>> a is b
True
>>> a == b
True
>>> c == "abc#"
False
>>> d == "abc#"
False
>>> a = "abc_33"
>>> b = "abc_33"
>>> a is b
True
>>> a == b
True
>>> a = "abc#"
>>> b = "abc#"
>>> a is b
False
>>> a == b
True

常用查找方法_去除首位信息_大小写转换_排版

字符串常用方法汇总

字符串有很多常用的方法,我们需要熟悉。我们通过表格将这些方法汇总起来,方便大家查阅。希望大家针对每个方法都做一次测试。

常用查找方法

我们以一段文本作为测试∶
a=’’‘我是张三,今年18岁了,我在北京上班。我的儿子叫张四,他6岁了。我是一个编程教育的普及者,希望影响6000万学习编程的中国人。我儿子现在也开始学习编程,希望他18岁的时候可以超过我’’’

方法和使用示例说明结果
len(a)字符串长度96
a.startswith(‘我是张三’)以指定字符串开头True
a.endswith(‘过我’)以指定字符串结尾True
a.fend(‘张’)第一次出现指定字符串的位置2
a.rfind(‘张’)最后一次出现指定字符串的位置29
a.count(“编程”)指定字符串出现了几次3
a.isalnum()所有字符全是字母或者数字False

去除首尾信息

strip()去除字符串首尾指定信息。
Istrip()去除字符串左边指定信息。
rstrip()去除字符串右边指定信息。

格式排版

center()、ljust()、rjust()这三个函数用于对字符串实现排版。

其他方法

  1. isalnum()是否为字母或数字
  2. isalpha()检测字符串是否只由字母组成(含汉字)。
  3. isdigit()检测字符串是否只由数字组成。
  4. isspace()检测是否为空白符
  5. isupper()是否为大写字母6. islower()是否为小写字母

format格式化_数字格式化操作

字符串的格式化

format()基本用法

Python2.6开始,新增了一种格式化字符串的函数str.format(),它增强了字符串格式化的功能。
基本语法是通过和∶来代替以前的%。
format函数可以接受不限个参数,位置可以不按顺序。
我们通过示例进行格式化的学习。

>>> a = "名字是:{0},年龄是:{1}"
>>> a.format("张三",18)
'名字是:张三,年龄是:18'
>>> a.format("李四",20)
'名字是:李四,年龄是:20'
>>> b = "名字是:{0},年龄是{1}。{0}是个好小伙。"
>>> b.format("王五",18)
'名字是:王五,年龄是18。王五是个好小伙。'
>>> c = "名字是{name},年龄是{age}"
>>> c.format(age=19,name="赵六")
'名字是赵六,年龄是19'

填充与对齐

填充常跟对齐一起使用
^、<、>分别是居中、左对齐、右对齐,后面带宽度
:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

>>> "{:*>8}".format("245")
'*****245'
>>> "我是{0},我喜欢数字{1:*^8}".format("张三",6)
'我是张三,我喜欢数字***6****'

数字格式化

浮点数通过f,整数通过d 进行需要的格式化。案例如下:

>>> a = "我是{0},我的存款有{1:.2f}"
>>> a.format("张三",288888.6666)
'我是张三,我的存款有288888.67'
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值