可变字符串
在python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用io.StringIO对象或array模块
>>>import io
>>>s='hello.sxt'
>>>sio = io.StringIO(s)
>>>sio
<_io.StringIO object at 0x000002496F8BE320>
>>>sio.getvalue()
'hello.sxt'
>>>sio.seek(7)
7
>>>sio.write("g")
1
>>>sio.getValue()
'hello.sgt'
基本运算符
前面学习了“+”、“-”、“*”、“/”、“//”、“%”等运算符
1.比较运算符可以连用,并且含义和我们日常使用完全一致
>>>a=4
>>>3<a<10 #关系运算符可以连用
>>>True
- 位操作
>>>a=0b11001 #0b是二进制
>>>b=0b01000
>>>a
25
>>>b
8
>>>c=a|b #a或b返回a
>>>c
25
>>>bin(c) #bin()可以将数字转成二进制表示
‘0b11001’
>>>c=a&b #a与b返回b
>>>c
8
>>>c=a^b
>>>c
17
>>>a=3
>>>a<<2 #左移1位相当于乘以2,左移2位,相当于乘以4
12
>>>a=8
>>>a>>1 #右移1位,相当于除以2
4
注:异或
1.计算a,b的二进制值:
2.^符号的作用是将两数字相同位置但是数值不同的值变为1,即经过^计算获得字符串‘ob11001’
3.随后将二进制的‘ob1101110’转化为十进制的值即为:17
以上就是^的计算过程。
Python位运算符
按位运算符是把数字看作二进制来进行计算的。Python中的按位运算法则如下:
下表中变量 a 为 60,b 为 13,二进制格式如下:
a = 0011 1100
b = 0000 1101
-----------------
a&b = 0000 1100
a|b = 0011 1101
a^b = 0011 0001
运算符 | 描述 | 实例 |
& | 按位与运算符:参与运算的两个值,如果两个相应位都为1,则该位的结果为1,否则为0 | (a & b) 输出结果 12 ,二进制解释: 0000 1100 |
| | 按位或运算符:只要对应的二个二进位有一个为1时,结果位就为1。 | (a | b) 输出结果 61 ,二进制解释: 0011 1101 |
^ | 按位异或运算符:当两对应的二进位相异时,结果为1 | (a ^ b) 输出结果 49 ,二进制解释: 0011 0001 |
<< | 左移动运算符:运算数的各二进位全部左移若干位,由 << 右边的数字指定了移动的位数,高位丢弃,低位补0。 | a << 2 输出结果 240 ,二进制解释: 1111 0000 |
>> | 右移动运算符:把">>"左边的运算数的各二进位全部右移若干位,>> 右边的数字指定了移动的位数 | a >> 2 输出结果 15 ,二进制解释: 0000 1111 |
- 加法操作
- 数字相加 3+2==>5
- 字符串拼接 “3”+“2”==>”32”
- 列表、元组等合并 [10,20,30]+[5,10,100]=[10,20,30,5,10,100]
- 乘法操作
- 数字相乘 3*2 ==>6
- 字符串复制 “abc”*3 ==> “abcabcabc”
- 列表、元祖等复制
[10,20,30]*3 ==>[10,20,30,10,20,30,10,20,30]
复合赋值运算符
复合赋值可以让程序更加精炼,提高效率
运算符优先级问题
实际使用中,记住如下简单规则即可,复杂表达式一定要使用小括号组织
- 乘除优先加减
- 位运算和算术运算>比较运算符>赋值运算符>逻辑运算符
==>(5+10*x)/5-13*(y-1)*(a+b)/x+9*(5/x+(12+x)/y)
第三章 序列
序列是一种数据存储方式,用来存储一系列的数据。在内存中,序列就是一块用来存放多个值连续的内存空间。比如一个整数序列[10,20,30,40],可以这样示意表示:
10 | 20 | 30 | 40 |
Python3中一切皆对象,在内存中实际是按照如下方式存储:
a=[10,20,30,40] (4个对象10,20,30,40都有各自地址,每个对象都有自己的①id②type③value)
把四个对象的地址依次存入序列中,最后通过索引可以找到变量a持有的地址a{0}=10
从图示中,我们可以看出序列中存储的是整数对象的地址,而不是整数对象的值。Python中常用的序列结构有:
字符串、列表、元组、字典、集合
字符串就是一种序列
列表简介
列表:用于存储任意数目、任意类型的数据集合
列表是内置可变序列,是包含多个元素的有序连续的内存空间。列表定义的标准语法格式:
a=[10,20,30,40]
其中,10,20,30,40这些称为:列表a的元素
列表中元素可以各不相同,任意类型。比如:
a=[10,20,’abc’,True]
列表常用方法:
Python列表大小可变,根据需要随时增加缩小
字符串和列表都是序列类型,一个字符串是一个字符序列,一个列表是任何元素的序列
列表的创建
基本语法[]创建
>>>a=[10,20,’gaoqi’,’sxt’]
>>>a=[] #创建一个空的列表对象
list()创建
使用list()可以将任何可迭代的数据转换成列表
>>>a=list() #创建一个空的列表对象
>>>a=list(range(10))
>>>a
[0,1,2,3,4,5,6,7,8,9]
>>>a= range(10)
>>>list(a)
[0,1,2,3,4,5,6,7,8,9]
>>>a=list(‘wang,abc’)
>>>a
['w', 'a', 'n', 'g', ',', 'a', 'b', 'c']
range()创建整数列表
range()可以帮助我们非常方便的创建整数列表,语法格式为:
Range([start,]end[,step])
start参数:可选,表示起始数字,默认为0
end参数:必选,表示结尾数字
Step:可选,表示步长,默认为1
Python3中range()返回的是一个range对象,而不是列表,我们需要通过list()方法将其转换成列表对象。
示例:
>>>list(range(0,10,1))
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>list(range(3,15,2))
[3, 5, 7, 9, 11, 13]
>>>list(range(15,3,-1))
[15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4]
>>>list(range(3,-10,-1))
[3, 2, 1, 0, -1, -2, -3, -4, -5, -6, -7, -8, -9]
推导式生成列表
使用推导式列表可以非常方
便的创建列表(涉及到for循环和if语句,仅基本介绍)
>>>a= [x*2 for x in range(5)] #循环创建多个元素 (x*2 即 0,1,2,3,4都乘2)
>>>a
[0, 2, 4, 6, 8]
>>>a= [x*2 for x in range(100) if x%9==0] #通过if过滤元素,能被9整除
>>>a
[0, 18, 36, 54, 72, 90, 108, 126, 144, 162, 180, 198]
列表元素的增加和删除
当列表增加和删除元素时,列表会自动进行内存管理,大大减少了程序员的负担。但这个特点涉及到列表元素的大量移动,效率较低。除非必要,我们一般只在列表的尾部添加元素或删除元素,这会大大提提高列表的操作效率。
Append()方法
原地修改列表对象,是真正的列表尾部添加新的元素,速度最快,推荐使用
>>>a=[20,40]
>>>a.append(60)
>>>a
[20, 40, 60]
+运算符操作
并不是真正的尾部添加元素,而是创建新得列表对象;将原列表的元素和新列表的元素依次复制到新的列表对象中。这样会涉及到大量的复制操作。对于操作大量元素不建议使用
>>>a=[20,40]
>>>id(a)
2830773703168
>>>a=a+[50]
>>>id(a)
2830773803584
通过如上测试,我们发现变量a的地址发生了变化。也就是创建了新的列表对象
extend()方法
将目标列表的所有元素添加到本列表的尾部,属于原地操作,不创建新的列表对象 (适合列表拼接)
>>>a=[20,40]
>>>id(a)
2830773702080
>>>a.extend([50,40]) #id不变,没创建新的对象
>>>id(a)
2830773702080
insert()方法
使用insert()方法可以将指定的元素插入到列表对象的任意指定位置。这样会让插入位置后面所有的元素进行移动,会影响处理速度。涉及大量元素时,应避免使用。类似发生这种移动的函数还有remove(),pop(),del(),它们在删除非尾部局部元素时也会发生操作位置后面元素的移动。
>>>a=[10,20,30]
>>>a.insert(2,100)
>>>a
[10, 20, 100, 30]
乘法扩展
使用乘法扩展列表,生成一个新列表,新列表元素是原列表元素的多次重复。
>>>a=['abcd',100]
>>>b=a*3
>>>a
['abcd', 100]
>>>b
['abcd', 100, 'abcd', 100, 'abcd', 100]
列表元素的删除
del删除
删除列表指定位置的元素(删除和增加本质上都是元素的拷贝,位置的挪动)
>>>a= [100,200,888,300,400]
>>>del a[2] #a[3]复制到a[2],a[4]复制到a[3]
>>>a
[100, 200, 300, 400]
pop()方法
pop()删除并返回指定位置元素,如果未指定位置则默认操作列表最后一个元素
>>>a = [10,20,30,40,50]
>>>a.pop()
50
>>>a
[10, 20, 30, 40]
>>>c=a.pop(1)
>>>c
20
>>>a
[10, 30, 40]
remove()方法
删除首次出现的指定元素,若不存在该元素抛出异常
>>>a=[10,20,30,40,50,20,30,20,30]
>>>a.remove(20) #直接写删除的元素,而不是索引
>>>a
[10, 30, 40, 50, 20, 30, 20, 30]
>>>a.remove(100)
Traceback (most recent call last):
File "<pyshell#56>", line 1, in <module>
a.remove(100)
ValueError: list.remove(x): x not in list
列表元素访问和计数
通过索引直接访问元素
我们可以通过索引直接访问元素。索引的区间在[0,列表长度-1]这个范围。超过这个范围则会抛出异常。
>>>a=[10,20,30,40,50,20,30,20,30]
>>>a[2]
30
>>>a[10]
Traceback (most recent call last):
File "<pyshell#59>", line 1, in <module>
a[10]
IndexError: list index out of range
Index()获得指定元素在列表中首次出现的索引
Index()可以获取指定元素首次出现的索引位置。语法是:index(value,[start,[end]])。其中,start和end指定了搜索的范围。
>>>a=[10,20,30,40,50,20,30,20,30]
>>>a.index(20)
1
>>>a.index(20,3)#从索引位置3开始往后搜索的第一个20
5
>>>a.index(30,5,7) #从索引位置5到7这个区间,第一次出现30的位置
6
count()获得指定元素在列表中出现的次数
count()可以返回指定元素在列表中出现的次数。
>>>a=[10,20,30,40,50,20,30,20,30]
>>>a.count(20)
3
len()返回列表长度
len()返回列表长度,即列表中包含元素的个数
>>>a=[10,20,30,40,50,20,30,20,30]
>>>len(a)
9
成员资格判断
判断列表中是否存在指定的元素,我们可以使用count()方法,返回0则表示不存在,返回大于0则表示存在。但是,一般我们会使用更加简洁的in关键字来判断,直接返回True或False
>>>a=[10,20,30,40,50,20,30,20,30]
>>>20 in a
True
>>>100 not in a
True
切片操作
列表的切片操作和字符串类似。
切片是python序列及其重要的操作,适用于列表、元组、字符串等等。切片格式如下:
切片slice操作可以让我们快速提取子列表或修改。标准格式为:
[起始偏移量start:终止偏移量end[:步长step]]
注:当步长省略时顺便可以省略第二个冒号
典型操作(三个量为正数的情况)如下:
>>>a = [10,20,30,40,50,60]
>>>a[:] #提取所有元素
[10, 20, 30, 40, 50, 60]
>>>a[1:3:1] #从1开始提取到3步长为1
[20, 30]
>>>a[1::2] #从1开始到末尾,步长为2
[20, 40, 60]
>>>a[1:] #从1开始,全部取出来
[20, 30, 40, 50, 60]
>>>a[:2] #默认从0开始取到2
[10, 20]
其他操作(三个量为负数)的情况:
>>>a = [10,20,30,40,50,60]
>>>a[-3:]
[40, 50, 60]
>>>a[-3:] #从倒数第三个开始
[40, 50, 60]
>>>a[-5:-3] #倒数第五个到倒数第三个(包头不包尾)
[20, 30]
>>>a[::-1] #步长为负,从右到左反向提取
[60, 50, 40, 30, 20, 10]
切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于0则会当做0,终止偏移量大于“长度-1”会被当成-1,例如:
>>>[10,20,30,40][1:30]
[20, 30, 40]
没有报错
列表的遍历
For obj in listObj:
Print(obj)
列表排序
修改原列表,不建新列表的排序
>>>a=[20,10,30,40]
>>>id(a)
2830773776448
>>>a.sort() #默认是升序排列2
>>>a
[10, 20, 30, 40]
>>>a.sort(reverse=True) #降序排列
>>>a
[40, 30, 20, 10]
>>>import random
>>>random.shuffle(a) #打乱顺序
>>>a
[10, 40, 20, 30]
建新列表的排序
我们也可以通过内置函数sorted()进行排序,这个方法返回新列表,不对原列表做修改
>>>a=[20,10,30,40]
>>>id(a)
2830773714368
>>>a=sorted(a) #默认升序
>>>a
[10, 20, 30, 40]
>>>id(a) #生成新的对象
2830773776448
reverse()返回迭代器
内置函数reversed()也支持进行逆序排列,与列表对象reverse()方法不同的是,内置函数reversed()不对原列表做任何修改,只是返回一个逆序排列的迭代器对象。
>>>a=[20,10,30,40]
>>>a[::-1] #通过切片实现逆序
[40, 30, 10, 20]
>>>c=reversed(a)
>>>c
<list_reverseiterator object at 0x000002931740F5B0>
>>>list(c)
[40, 30, 10, 20]
>>>list(c)
[]
我们打印输出c发现提示是:list_reverseiterator。也就是一个迭代对象。同时,我们使用list(c)进行输出,发现只能用一次。第一次输出了元素,第二次为空,那是因为迭代对象在第一次时已经遍历结束了。第二次不能再使用。
列表相关的其他内置函数汇总
max 和 min
用于返回列表中最大和最小值
>>>a=[3,10,20,15,9]
>>>max(a)
20
>>>min(a)
3
sum
对数值类型列表的所有元素进行求和操作,对非数值型列表运算则会报错。
>>>a=[3,10,20,15,9]
>>>sum(a)
57
多维列表
二维列表
一维列表可以帮助我们存储一维、线性的数据。
二维列表可以帮助我们存储二维、表格的数据。例如下表数据:
姓名 年龄 薪资 城市 | |||
高小一 | 18 | 30000 | 北京 |
高小二 | 19 | 20000 | 上海 |
高小五 | 20 | 10000 | 深圳 |
>>>a=[]
>>>a=[
['高小一',18,30000,'北京'],
['高小二',19,20000,'上海'],
['高小五',20,10000,'深圳']
]
>>>a
[['高小一', 18, 30000, '北京'], ['高小二', 19, 20000, '上海'], ['高小五', 20, 10000, '深圳']]
>>>a[0]
['高小一', 18, 30000, '北京']
>>>a[0][3]
'北京'
>>>print(a[1][0],a[1][1],a[1][2])
>>>高小二 19 20000
嵌套循环打印二维列表所以数据
>>>a=[
['高小一',18,30000,'北京'],
['高小二',19,20000,'上海'],
['高小五',20,10000,'深圳']
]
>>>for m in range(3):
>>>> for n in range(4):
>>>> print(a[m][n],end='\t')
>>>> print() #打印好一行,换行
高小一 18 30000 北京
高小二 19 20000 上海
高小五 20 10000 深圳
元组tuple
列表属于可变序列,可以任意修改列表中的元素,元组属于不可变序列,不能修改元组中的元素。因此,元组没有增加元素、修改元素、删除元素相关的方法。
因此,我们只要学习元组的创建和删除,元组中的元素的访问和计数即可,元组支持如下操作:
- 索引访问
- 切片操作
- 连接操作
- 成员关系操作
- 比较运算操作
- 计数:元组长度len()、最大值max()、最小值min()、求和sum()等。
元组的创建
- 通过()创建元组。小括号可以省略 (列表是用[]创建)
a= (10,20,30) 或者 a=10,20,30
如果元组只有一个元素,则必须后面加逗号,这是因为解释器会把(1)解释为整数1,(1,)解释为元组
>>>a=(1)
>>>type(a)
<class 'int'>
>>>a=(1,)
>>>type(a)
<class 'tuple'>
2.通过tuple()创建元组。
tuple(可迭代的对象) (转化为元组)
>>>b=tuple() #创建一个空元组对象
>>>b=tuple('abc')
>>>b
('a', 'b', 'c')
>>>b=tuple(range(3))
>>>b
(0, 1, 2)
>>>b=tuple([2,3,4])
>>>b
(2, 3, 4)
总结:
tuple()可以接收列表、字符串、其他序列类型、迭代器等生成元组
list()可以接收元组、字符串、其他序列类型、迭代器生成列表。
元组的元素访问和计数
1.元组的元素不能修改
>>>a=(20,30,40)
>>>a[1]=5
Traceback (most recent call last):
File "<pyshell#149>", line 1, in <module>
a[1]=5
TypeError: 'tuple' object does not support item assignment
2.元组的元素访问和列表一样,只不过返回的仍然是元组
>>>a=(20,10,30,9,8)
>>>a[1]
10
>>>a[1:3]
>>>(10, 30)
>>>a[:4]
(20, 10, 30, 9)
3.列表关于排序的方法list.sorted()是修改原列表对象,元组没有该方法,如果要对元组排序,只能使用内置函数sorted(tupleObj),并生成新的列表对象
>>>a=(20,10,30,5,4)
>>>sorted(a)
[4, 5, 10, 20, 30]
ZIP
Zip(列表1,列表2...)将多个列表对应位置的元素组合为元组,并返回这个zip对象
>>>a=[10,20,30]
>>>b=[40,50,60]
>>>c=[70,80,90]
>>>zip(a,b,c)
<zip object at 0x000002931742F540>
>>>d = zip(a,b,c)
>>>list(d)
[(10, 40, 70), (20, 50, 80), (30, 60, 90)]
生成器推导式创建元祖
【操作】生成器的使用测试
>>>s=(x*2 for x in range(5))
>>>S #生成器
<generator object <genexpr> at 0x00000293173EDD20>
>>>tuple(s)
(0, 2, 4, 6, 8)
>>>list(s) #生成器只能用一次
[]
>>>S #生成器只能用一次
<generator object <genexpr> at 0x00000293173EDD20>
>>>tuple(s)
()
>>>s=(x*2 for x in range(5))
>>>s.__next__()
0
>>>s.__next__()
2
>>>s.__next__()
4
>>>s.__next__()
6
>>>s.__next__()
8
>>>s.__next__()
Traceback (most recent call last):
File "<pyshell#175>", line 1, in <module>
s.__next__()
StopIteration
元组总结
- 元组的核心特点是:不可变序列
- 元组的访问和处理速度比列表块
- 与整数和字符串一样(元组、整数、字符串都是不可变的),元组可以作为字典的键,列表则永远不能作为字典的键使用