序列

序列

序列是一种数据存储方式,用来存储一系列的数据,在内存中,序列就是一块用来存放多个值的连续的内存空间
eg. a=[10,20,30,40]
在这里插入图片描述
实际存储方式:
在这里插入图片描述
从图示中,可以看出序列中存储的是整数对象的地址,而不是整数对象的值

Python中常用的序列结构有:

  1. 字符串(字符序列)
  2. 列表
  3. 元祖
  4. 字典
  5. 集合

列表

  • 列表:用于存储任意数目、任意类型的数据集合 列表是内置可变序列,是包含多个元素的有序连续的存储空间。列表定义的标准语法格式:a=[10,20,30,40]。 其中,10,20,30,40称为列表a的元素

  • 列表中的元素可以各不相同,可以是任意类型。比如:
    a=[10,20,‘abc’,True]

  • Python的列表大小可变,根据需要随时增加或缩小

  • 字符串和列表都是序列类型,字符串是字符序列,列表是任何元素的序列。很多字符串的方法,在列表中也有类似的用法,几乎一模一样

列表对象的常用方法:

方法描述
list.append(x)将元素x增加到列表list尾部
list.extend(aList)将列表alist所有元素加到列表list尾部
list.insert(index,x)在列表list指定位置index处插入元素x
list.remove(x)在列表list中删除首次出现的指定元素x
list.pop([index])删除并返回列表list指定为index处的元素,默认是最后一个元素
list.clear()删除列表所有元素,并不是删除列表对象
list.index(x)返回第一个x的索引位置,若不存在x元素抛出异常
list.count(x)返回指定元素x在列表list中出现的次数
len(list)返回列表中包含元素的个数
list.reverse()所有元素原地翻转
list.sort()所有元素原地排序
list.copy()返回列表对象的浅拷贝

列表的创建

  1. 基本语法[ ]创建
    a = [10,20,‘gaoqi’,‘sxt’]
  2. list()创建,使用list()可以将任何可迭代的数据转化成列表
    a=list(“gaoqi”) = > [‘g’,‘a’,‘o’,‘q’,‘i’]
    a=range(10) =>是一个range对象,不是列表
    list(a) =>转成列表对象[0,1,2,3,4,5,6,7,8,9]
    可以直接写成list(range(10))
  3. range()创建整数列表
    range([start,]end[,step])
    start参数:可选,表示其实数字,默认是0
    end参数:必选,表示结尾数字
    step参数:可选,表示步长,默认为1
    Python3中range()返回的是一个range对象,而不是列表。我们需要通过list()方法将其转换成列表对象
    eg. list(range(15,3,-1)) => [15,14,13,12,11,10,9,8,7,6,5,4]
  4. 推导式生成列表
    使用列表推导式可以非常方便的创建列表,在开发中经常使用,涉及到for循环和if语句
    eg. 循环创建多个元素
    a=[x2 for x in range(5)] => [0,2,4,6,8]
    eg. 通过if过滤元素
    a=[x
    2 for x in range(100) if x%9==0] => [0,18,36,54,72,90,108,126,180,190]

当列表增加和删除元素时,列表会自动进行内存管理,大大减少了程序员的负担。但这个特点设计列表元素的大量移动,效率较低。除非必要,我们一般只在列表的尾部添加元素或删除元素,这会大大提高列表的操作效率。

列表元素的增加

  1. append()方法:原地修改列表对象,使真正的列表尾部添加新的元素,速度快,推荐使用
>>> a=[20,40]
>>> a.append(100)
>>> a
[20,40,100]
>>> a.append(200)
>>> a
[20,40,100,200]
  1. +运算操作符:并不是真正的尾部添加元素,而是创建新的列表对象,将原列表的元素和新列表的元素一次复制到新的列表对象中,这样,会涉及大量的复制操作,对于操作大量元素不建议使用
>>> id(a)
46990760
>>> a = a+[50]
>>> a
[20,40,100,200,50]
>>> id(a)
47066808
  1. extend()方法:将目标列表的所有元素添加到本列表的尾部,属于原地操作,不创建新的列表对象,如果要拼接两个列表,推荐使用这个方法,效率比较高
>>> a= [20,40]
>>> id(a)
46016072
>>> a.extend([50,60])
>>> id(a)
46016072
  1. insert()插入元素:可以将指定元素插入到列表对象的任意指定位置。这样会让插入位置后面所有的元素进行移动,会影响处理速度。涉及大量元素时,尽量避免使用。类似发生这种移动的函数还有:remove()、pop()、del(),它们在删除非尾部元素时也会发生操作位置后面元素的移动
>>> a = [10,20,30]
>>> a.insert(2,100)
>>> a
[10,20,100,30]
  1. 乘法扩展:使用乘法扩展列表,生成一个新列表,新列表元素是原列表元素的多次重复。适用于乘法操作的还有字符串、元祖等
>>> a = ['sxt',100]
>>> b=a*3
>>> a
['sxt',100]
>>> b
['sxt',100,'sxt',100,'sxt',100]

列表元素的删除

  1. del 删除:删除列表指定位置的元素
>>> a = [10,20,30]
>>> del a[1]
>>> a
[10,30]

本质上就是数组的拷贝,把30拷贝到20的位置,如果后面还有元素的话,会把后面的元素拷贝到30的位置,这样依次拷贝(增加元素也是数组的拷贝)

  1. pop()方法:删除并返回指定位置元素,如果未指定位置则默认操作列表最后一个元素
>>> a = [10,20,30,40,50]
>>> b = a.pop()
>>> b
50
>>> a
[10,20,30,40]
>>> a.pop(1)
20
>>>a
[10,30,40]
  1. remove()方法:删除首次出现的指定元素,若不存在该元素抛出异常
>>> a = [10,20,30,40,50,20,30,20,30]
>>> a.remove(20)
>>> a
[10,30,40,50,20,30,20,30]
>>> a.remove(100)
Traceback (most recent call last):
    File "<pyshell#208>", Line 1, in <module>
       a.remove(100)
 ValueError: list.remove(x): x not in list

列表的访问和计数

  1. 通过索引直接访问元素
    我们可以通过索引直接访问元素。索引的区间在[0, 列表长度-1]这个范围,超过这个范围则会抛出异常
>>> a = [10,20,30,40,50,20,30,20,30]
>>> a[2]
30
  1. index()获得指定元素在列表中首次出现的索引
>>> a = [10,20,30,40,50,20,30,20,30]
>>> a.index(20)
1
>>> a.index(20,3)  #从索引位置3开始往后搜索的第一个20
5
>>> a.index(30,5,7)  #从索引位置5到7这个区间,第一次出现30的位置
6
  1. count()获得指定元素在列表中出现的次数
>>> a = [10,20,30,40,50,20,30,20,30]
>>> a.count(20)
3
  1. len()返回列表长度
>>> a = [10,20,30]
>>> len(a)
3
  1. 成员资格判断
    判断列表中是否存在指定的元素,我们可以使用count()方法,返回0表示不存在,返回大于0则表示存在。但是,一般我们会使用更加简洁的in关键字来判断,直接返回True或False
>>> a = [10,20,30,40,50,20,30,20,30]
>>> 20 in a
True
>>> 100 not in a
True

切片操作
切片是Python序列极其重要的操作,适用于列表、元祖、字符串等等
切片slice操作可以让我们快速提取子列表或修改,格式:
[起始偏移量start:终止偏移量end[,步长step]]

操作和说明示例
[:] 提取整个列表[10,20,30][:] => [10,20,30]
[start:] 从start索引开始到结尾[10,20,30][1:] => [20,30]
[:end] 从头开始直到end-1[10,20,30][:2] => [10,20]
[start:end] 从start到end-1[10,20,30][1:3][20,30]
[start: end :step] 从start提取到end-1,步长是step[10,20,30,40,50,60,70][1:6:2] =>[20,40,60]
倒数三个[10,20,30,40,50,60,70][-3:] => [50,60,70]
倒数第五个到倒数第三个(包头不包尾)[10,20,30,40,50,60,70][-5:-3] =>[30,40]
步长为负,从右到左反向提取[10,20,30,40,50,60,70][::-1] => [70,60,50,40,30,20,10]

切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小雨0则会被当作0,终止偏移量大于"长度-1"会被当成-1

列表的遍历
for obj in listObj:
print(obj)

eg.

>>> a=[10,20,30,40,50]
>>> for x in a:
             print(x)
10
20
30
40
50

列表排序

  1. 修改原列表,不创建新列表的排序
>>> a=[20,10,30,40]
>>> id(a)
46017416
>>> a. sort()  #默认是升序排列
>>> a
[10,20,30,40]
>>> a = [10,20,30,40]
>>> a.sort(reverse=True)  #降序排列
>>> a
[40,30,20,10]
>>> import random
>>> random.shuffle(a)  #打乱顺序
>>> a
[20,40,30,10]
  1. 建新列表的排序:内置函数sorted(),这个方法返回新列表,不对原列表做修改
>>> a= [20,10,30,40]
>>> id(a)
46016008
>>> a=sorted(a)    #默认升序 
>>> a
[10,20,30,40]
>>> id(a)
45907848
>>> c=sorted(a,reverse=True)    #降序
>>> c
[40,30,20,10]
  1. reversed()返回迭代器:内置函数reversed()也支持进行逆序排列,与列表对象reverse()方法不同的是,内置函数reversed()不对原列表做任何修改,只是返回一个逆序排列的迭代器对象
>>> a = [20,10,30,40]
>>> c = reversed(a)
>>> c
<list_reverseiterator object at 0x0000000002BCCEBB>
>>> list(c)
[40,30,10,20]
>>> list(c)  #迭代器只能用一次
[]

列表相关的其他内置函数:

  1. max和min:用于返回列表中最大和最小值
>>> a = [3,10,20,15,9]
>>> max(a)
20
>>> min(a)
3
  1. sum:对数值型列表的所有元素进行求和操作,对非数值型列表运算则会报错
>>> a = [3,10,20,15,9]
>>> sum(a)
57

多维列表

二维列表

  • 一维列表可以帮助我们存储一维、线性的数据
  • 二维列表可以帮助我们存储二维、表格的数据

eg.
在这里插入图片描述

a = [
             ["高小一",18, 30000,"北京"],
             ["高小二",19, 20000,"上海"],
             ["高小三",20, 10000,"深圳"]
       ]

内存结构图:
在这里插入图片描述

for m in range(3):
     for n in range(4):
            print(a[m][n], end="\t")
      print()   #打印完一行,换行
 
结果:
高小一       18           30000      北京
高小二       19           20000      上海
高小三       20           10000      深圳

元组 tuple

  • 列表属于可变序列,可以任意修改列表中的元素。元组属于不可变序列,不能修改元组中的元素。因此,元组没有增加元素、修改元素、删除元素相关的方法
  • 因此,我们只需要学习元组的创建和删除,元组中元素的访问和计数即可。元组支持如下操作
    1. 索引访问
    2. 切片操作
    3. 连接操作
    4. 成员关系操作
    5. 比较运算操作
    6. 计数:元组长度len()、最大值max()、最小值min()、求和sum()等

元组的创建

  1. 通过()创建元组,小括号可以省略。如果元组只有一个元素,则必须后面加逗号。这是因为解释器会把(1)解释为整数1,(1,)解释为元组
a  = (10,20,30)   或   a = 10,20,30
  1. 通过tuple()创建元组
>>> b = tuple()   #创建一个空元组对象
>>> b = tuple("abc")
>>> b
('a','b','c')
>>> b = tuple(range(3))
>>> b
(0,1,2)
>>>b = tuple([2,3,4])
(2,3,4)
>>> del b   #删除元组

总结:

  1. tuple()可以接收列表、字符串、其他序列类型、迭代器等生成元组
  2. list()可以接收元组、字符串、其他序列类型、迭代器等生成列表

元组的元素访问和计数

  1. 元组的元素不能修改
>>> a = (20,10,30,9,8)
>>> a[3] = 33
Traceback (most recent call last):
     File "<pyshell#313>", line 1, in <module>
         a[3] = 33
 TypeError: 'tuple' object does not support item assignment
  1. 元组的元素访问和列表一样,只不过返回的仍然是元组对象
>>> a = (20,10,30,9,8)
>>> a[1]
10
>>> a[1:3]
(10,30)
>>> a[:4]
(20,10,30,9)
  1. 列表关于排序的方法list.sort()是修改原列表对象,元组没有该方法。如果要对元组排序,只能使用内置函数sorted(tupleObj),并生成新的元组列表
>>> a = (20,10,30,9,8)
>>> sorted(a)
[8,9,10,20,30]
  1. zip:将多个列表对象对应位置的元素组合称为元组,并返回这个zip对象
>>> a = [10,20,30]
>>> b = [40,50,60]
>>> c = [70,80,90]
>>> d = zip(a,b,c)
>>> list(d)
[(10,40,70),(20,50,80),(30,60,90)]

生成器推导式创建元组

  • 从形式上看,生成器推导式与列表推导式类似,只是生成器推导式使用小括号。列表推导式直接生成列表对象,生成器推导式生成的不是列表也不是元组,而是一个生成器对象。
  • 我们可以通过生成器对象,转化成列表或者元组。也可以使用生成器对象的_ _ next _ _()方法进行遍历,或者直接作为迭代器对象来使用。不管什么方式使用,元素访问结束后,如果需要重新访问其中的元素,必须重新创建该生成器对象
>>> s = (x*2 for x in range(5))
>>> s._ _next_ _()
0
>>> s._ _next_ _()
2
>>> s._ _next_ _()
4
>>> s._ _next_ _()
6
>>> s._ _next_ _()
8
>>> s._ _next_ _()
Traceback (most recent call last):
     File "<pyshell#10>", line 1, in <module>
       s._ _next_ _()
 StopIteration
>>> s
<generator object <genexpr> at 0x0000000002BDEB48>
>>> tuple(s)
(0,2,4,6,8)
>>> list(s)    #只能访问一次元素,第二次就为空了,需要再生成一次
[]
>>> s
<generator object <genexpr> at 0x0000000002BDEB48>

元组的总结:

  1. 元组的核心特点是:不可变序列
  2. 元组的访问和处理速度比列表快
  3. 与整数和字符串一样,元组可以作为字典的键,列表则永远不能作为字典的键使用

字典

  1. 字典是“键值对”的无序可变序列,字典中的每个元素都是一个“键值对”,包含:“键对象”和“值对象”。可以通过“键对象”实现快速获取、删除、更新对应的“值对象”。
  2. 列表中,我们通过“下表数字”找到对应的对象。字典中通过“键对象”找到对应的“值对象”。“键”是任意的不可变数据,比如:整数、浮点数、字符串、元组。但是,列表、字典、集合这些可变对象,不能作为“键”。并且“键不可重复”。如果后面出现和前面相同的“键”,后面的“键”会覆盖前面的
  3. “值”可以是任意的数据,并且可重复

字典的创建

  1. 通过{}创建字典对象
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> c = {} #空的字典对象
  1. 通过dict()创建字典对象
>>> b = dict(name='gaoqi',age=18,job='programmer')
>>> a = dict([("name","gaoqi"),("age",18)])
>>> d = dict() #空的字典对象
  1. 通过zip()创建字典对象
>>> k = ['name','age','job']
>>> v = ['gaoqi',18,'teacher']
>>> d = dict(zip(k,v))
>>> d
{'name':'gaoqi','age':18,'job':'programmer'}
  1. 通过fromkeys创建值为空的字典
>>> a = dict.fromkeys(['name','age','job'])
>>> a
('name':None,'age':None,'job':None)

字典元素的访问
eg. a = {‘name’:‘gaoqi’,‘age’:18,‘job’:‘programmer’}

  1. 通过[键]获得“值”。若键不存在,则抛出异常
>>> a['name']
'gaoqi'
>>> a['age']
18
>>> a['sex']
Traceback (most recent vall last):
    File "<pyshell#374>", line 1, in <module>
KeyError: 'sex'
  1. 通过get()方法获得“值”。推荐使用。优点是:指定键不存在,返回None;也可以设定指定键不存在时默认返回的对象。推荐使用get()获取“值对象”
>>> a.get('name')
'gaoqi'
>>> a.get('sex')
None
>>> a.get('sex','一个男人')
'一个男人'
  1. 列出所有的键值对
>>> a.items()
dict_items([('name','gaoqi'),('age',18),('job','programmer')])
  1. 列出所有的键,列出所有的值
>>> a.keys()
dict_keys(['name','age','job'])
>>> a.values()
dict_values(['gaoqi',18,'programmer'])
  1. len()键值对的个数
  2. 检测一个“键”是否存在字典中
>>> "name" in a
True

字典元素添加、修改、删除

  1. 给字典新增“键值对”。如果“键”已经存在,则覆盖旧的键值对;如果“键”不存在,则新增“键值对”
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> a['address'] = '西三旗1号院'
>>>a['age']=16
>>> a
{'name':'gaoqi','age':16,'job':'programmer','address':'西三旗1号院'}
  1. 使用update()将新字典中所有键值对全部添加到旧字典对象上。如果key有重复,则直接覆盖
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> b = {'name':'gaoxixi','money':1000,'sex':'男的'}
>>> a.update(b)
>>> a
{'name':'gaoxixi','age':18,'job':'programmer','money':1000,'sex':'男的'}
  1. 字典元素的删除,可以使用del()方法;或者clear()删除所有键值对;pop()删除指定键值对,并返回对应的“值对象”
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> del(a['name'])
>>> a
{'age':18,'job':'programmer'}
>>> b = a.pop('age')
>>> b
>18
  1. popitem():随机删除和返回该键值对。字典是“无序可变序列”,因此没有第一个元素,最后一个元素的概念;popitem弹出随机的项,因为字典并没有“最后的元素”或者其他有关顺序的概念。若想一个接一个地移除并处理项,这个方法就非常有效(因为不用首先获取键的列表)
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> a.popitem()
('job','programmer')
>>> a
{'name':'gaoqi','age':18}
>>> a.popitem()
('age',18)
>>> a
{'name':'gaoqi'}

序列解包
序列解包可以用于元组、列表、字典。序列解包可以让我们方便的对多个变量赋值

>>> x,y,z=(20,30,10)
>>> x
20
>>> y
30
>>> z
10
>>> (a,b,c)=(9,8,10)
>>> a
9
>>> [a,b,c] = [10,20,30]
>>> a
10
>>> b
20

序列解包用于字典时,默认是对“键”进行操作;如果需要对键值对操作,则需要使用items();如果需要对“值”进行操作,则需要使用values()

>>> s = {'name':'gaoqi','age':18,'job':'teacher'}
>>> name,age,job = s    #默认对键进行操作
>>> name
'name'
>>> name,age,job = s.items()    #对键值对进行操作
>>> name
('name','gaoqi')
>>> name,age,job = s.values()   #对值进行操作
>>> name
'gaoqi'

表格数据使用字典和列表存储,并实现访问
在这里插入图片描述

r1 = {"name":"高小一","age":18,"salary":30000,"city":"北京"}
r2 = {"name":"高小二","age":19,"salary":20000,"city":"上海"}
r3 = {"name":"高小五","age":20,"salary":10000,"city":"深圳"}

tb = [r1,r2,r3]

#获得第二行的人的薪资
print(tb(1).get("salary"))

#打印表中多有的薪资
for i in range(len(tb)):
    print( tb(i).get("salary"))

#打印表的所有数据
for i in range(len(tb)):
     print( tb(i).get("salary"), tb(i).get("age"),tb(i).get("salary"),tb(i).get("city"))

字典核心底层原理

  • 字典对象的核心是散列表。散列表是一个稀疏数组(总是有空白元素的数组),数组的每个但愿叫做bucket。每个bucket有两部分:一个是键对象的引用,一个是值对象的引用。
  • 由于所有bucket结构和大小一致,我们可以通过偏移量来读取指定bucket
    在这里插入图片描述
  1. 将一个键值对放进字典的底层过程
>>> a = {}
>>> a["name"] = "gaoqi"

假设字典a对象创建完后,数组长度为8
在这里插入图片描述
我们要把"name"="gaoqi"这个键值对放到字典对象a中,首先第一步需要计算键"name"的散列值,Python中可以通过hash()来计算

>>> bin(hash("name"))
'-0b1010111101001110110101100100101'

由于数组长度为8,我们可以拿计算出的散列值的最右边3位数字作为偏移量,即"101",十进制是数字5.我们查看偏移量5,对应的bucket是否为空。如果为空,则将键值对放进去。如果不为空,则一次取右边3位作为偏移量,即"100",十进制是数字4。再查看偏移量为4的bucket是否为空。知道找到为空的bucket将键值对放进去。如果数组有2/3已经满了,字典会自动扩容。扩容指的是创造更大的数组,将原有内容拷贝到新数组中

  1. 根据键查找“键值对”的底层过程
>>> a.get("name")
'gaoqi'

当我们调用a.get(“name”),就是根据键"name"查找到“键值对”,从而找到值对象"gaoqi"。
第一步,我们仍然要计算"name"对象的散列值:

>>> bin(hash("name"))
'-0b1010111101001110110101100100101'

和存储的底层流程算法一致,也是一次取散列值的不同位置的数字。假设数组长度为8,我们可以拿计算出的散列值的最右边3位数字作为偏移量,即“101”,十进制数字5,我们查看偏移量5,对应的bucket是否为空。如果为空,则返回None。如果不为空,则将这个bucket的键对象计算对应散列值,和我们的散列值进行比较,如果相等,则将对应“值对象”返回。如果不相等,则再依次取其他几位数字,重新计算偏移量。依次取完后,仍然没有找到,则返回None

用法总结:

  1. 键必须可散列
    (1)数字、字符串、元组,都是可散列的
    (2)自定义对象需要支持下面三点:a. 支持hash()函数 b. 支持 _ _ eq _ _()方法检测相等性 c. 若a==b位真,则hash(a)==hash(b)也为真

  2. 字典在内存中开销巨大,典型的空间换时间

  3. 键查询速度很快

  4. 往字典里面添加新键可能导致扩容,导致散列表中键的次序变化。因此,不要在遍历字典的同时进行字典的修改

集合

集合是无序可变,元素不能重复。实际上,集合底层是字典实现,集合的所有元素都是字典中的“键对象”,因此是不能重复的且唯一的

集合创建和删除

  1. 使用{ }创建集合对象,并使用add()方法添加元素
>>> a = {3,5,7}
>>> a
{3,5,7}
>>> a.add(9)
>>> a
{9,3,5,7}
  1. 使用set(),将列表、元组等可迭代对象转成集合。如果原来数据存在重复数据,则只保留一个
>>> a = ['a','b','c','b']
>>> b = set(a)
>>> b
{'b','a','c'}
  1. remove()删除指定元素;clear()清空整个集合
>>> a = {10,20,30,40,50}
>>> a.remove(20)
>>> a
{10,50,30,40}
>>> a.clear()
>>> a
set()

集合相关操作
像数学中概念一样,Python对集合也提供了并集、交集、差集等运算

>>> a = {1,3,'sxt'}
>>> b = {'he','it','sxt'}
>>> a|b   #并集
{1,3,'sxt','he','it'}
>>> a&b   #交集
{'sxt'}
>>> a-b   #差集
{1,3}
>>> a.union(b)    #并集
{1,3,'sxt','he','it'}
>>> a.difference(b)   # 差集
{1,3}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值