Python学习day04

序列

序列是一种数据存储方式,用来存储一系列的数据。在内存中,序列就是一块用来存放多个值的连续的内存空间。比如一个整数序列[10,20,30,40],可以这样示意表示:

由于Python3中一切皆对象,在内存中实际是按照如下方式存储的:

a = [10,20,30,40]

从图示中,我们可以看出序列中存储的是整数对象的地址,而不是整数对象的值。python中常用的序列结构有:

字符串、列表、元组、字典、集合

列表简介

列表:用于存储任意数目、任意类型的数据集合。

列表是内置可变序列,是包含多个元素的有序连续的内存空间。列表定义的标准语法格式:

a = [10,20,30,40]

其中,10,20,30,40这些称为:列表a的元素。

列表中的元素可以各不相同,可以是任意类型。比如:

a = [10,20,'abc',True]

列表对象的常用方法汇总如下,方便大家学习和查阅。

方法

要点

描述

list.append(x)

增加元素

将元素x增加到列表list尾部

list.extend(aList)

增加元素

将列表alist所有元素加到列表list尾部

list.insert(index,x)

增加元素

在列表list指定位置index处插入元素x

list.remove(x)

删除元素

在列表list中删除首次出现的指定元素x

list.pop([index])

删除元素

删除并返回列表list指定为止index处的元素,默认是最后一个元素

list.clear()

删除所有元素

删除列表所有元素,并不是删除列表对象

list.index(x)

访问元素

返回第一个x的索引位置,若不存在x元素抛出异常

list.count(x)

计数

返回指定元素x在列表list中出现的次数

len(list)

列表长度

返回列表中包含元素的个数

list.reverse()

翻转列表

所有元素原地翻转

list.sort()

排序

所有元素原地排序

list.copy()

浅拷贝

返回列表对象的浅拷贝

Python的列表大小可变,根据需要随时增加或缩小。

字符串和列表都是序列类型,一个字符串是一个字符序列,一个列表是任何元素的序列。我们前面学习的很多字符串的方法,在列表中也有类似的用法,几乎一模一样。

列表的创建

基本语法[]创建

range()创建整数列表

range()可以帮助我们非常方便的创建整数列表,这在开发中及其有用。语法格式为:

range([start,] end [,step])

start参数:可选,表示起始数字。默认是0

end参数:必选,表示结尾数字。

step参数:可选,表示步长,默认为1

python3中range()返回的是一个range对象,而不是列表。我们需要通过list()方法将其转换成列表对象。

典型示例如下图

推导式生成列表(简介——>例子)

使用列表推导式可以非常方便的创建列表,在开发中经常使用。但是,由于涉及到for循环和if语句。在此,仅做基本介绍。在我们控制语句后面,会详细讲解更多列表推导式的细节。

这里解释一下,range(5)表示0,1,2,3,4 而X是一个变量,用于存储range的元素,如0,1,2,3,4

X*2是一个计算表达式,依次按顺序的把元素中的数值*2,如0*2=0,1*2=2,2*2=4,2*3=6,2*4=8,

得到的结果会按照顺序生成新的列表存放在变量a中所以得出的结果如下图所示

下图在上一个例子中的基础上,更改range的数量变为100个,增加了一个if 判断语句,如果能够被9整除的,或者说对9取余数为0的数值才会显示在列表中,这样就能很好的解释为何下图会显示0,18,36.......等数值

列表元素的增加和删除

当列表增加和删除元素时,列表会自动进行内存管理,大大减少了程序员的负担。但这个特点涉及列表元素的大量移动,效率较低。除非必要,我们一般只在列表的尾部添加元素或删除元素,这会大大提高列表的操作效率。

append()方法

原地修改列表对象,是真正的列表尾部添加新的元素,速度最快,推荐使用。

例子:在原有的列表元素后面添加一个元素

+运算符操作

并不是真正的尾部添加元素,而是创建新的列表对象;将原列表的元素和新列表的元素依次复制到新的 列表对象中。这样,会涉及大量的复制操作,效率低,对于操作大量元素不建议使用。

例子:通过测试,我们发现变量a的地址发生了变化。也就是创建了新的列表对象

extend()方法

将目标列表的所有元素添加到本列表的尾部,属于原地操作,不创建新的列表对象。

例子:在原有的列表元素中添加3个元素

insert()插入元素

使用insert()方法可以将指定的元素插入到列表对象的任意制定位置。这样会让插入位置后面所有的元素进行 移动,会影响处理速度。涉及大量元素时,尽量避免使用。类似发生这种移动的函数还有:remove()、 pop()、del(),它们在删除非尾部元素时也会发生操作位置后面元素的移动。

例子:使用insert()方法插入指定的元素,insert(索引,元素),这里的索引是指元素的位置

乘法扩展

例子:使用乘法扩展列表,生成一个新列表,新列表元素时原列表元素的多次重复。

列表元素的删除

del 删除

例子:删除列表指定位置的元素。b【1】,数字“1”代表删除位置索引

pop()方法

例子:pop()删除并返回指定位置元素,如果未指定位置则默认操作列表最后一个元素。

remove()方法

例子:删除首次出现的指定元素,若不存在该元素抛出异常。

列表元素访问和计数

通过索引直接访问元素

我们可以通过索引直接访问元素。索引的区间在[0, 列表长度-1]这个范围。超过这个范围则会抛出异常。

index()获得指定元素在列表中首次出现的索引

index()可以获取指定元素首次出现的索引位置。语法是:index(value,[start,[end]])。其中,start和end指定了搜索的范围。

例子1:返回元素a的索引位置

例子2:指定范围内返回元素a的位置

例子3:指定范围内返回元素c的位置

count()获得指定元素在列表中出现的次数

例子:注意使用count函数时查找元素出现次数一定要类型匹配,不然会出现下图的结果,

一个是数值类型的c,出现次数为0,一个是字符类型的'c',出现次数为2次,字符类型的C才是我们需要的正确答案。

len()返回列表长度

例子:len()返回列表长度,即列表中包含元素的个数。

成员资格判断

判断列表中是否存在指定的元素,我们可以使用count()方法,返回0则表示不存在,返回大于0则表示存在。但是,一般我们会使用更加简洁的in关键字来判断,直接返回True或False。

例子

切片操作

我们在前面学习字符串时,学习过字符串的切片操作,对于列表的切片操作和字符串类似。

切片是Python序列及其重要的操作,适用于列表、元组、字符串等等。切片的格式如下:

切片slice操作可以让我们快速提取子列表或修改。标准格式为:

[起始偏移量start:终止偏移量end[:步长step]]

注:当步长省略时顺便可以省略第二个冒号

典型操作(三个量为正数的情况)如下:

操作和说明

示例

结果

[:] 提取整个列表

[10,20,30][:]

[10,20,30]

[start:]从start索引开始到结尾

[10,20,30][1:]

[20,30]

[:end]从头开始知道end-1

[10,20,30][:2]

[10,20]

[start:end]从start到end-1

[10,20,30,40][1:3]

[20,30]

[start:end:step]从start提取到end-1,步长是step

[10,20,30,40,50,60,70][1:6:2]

[20, 40, 60]

其他操作(三个量为负数)的情况:

示例

说明

结果

[10,20,30,40,50,60,70][-3:]

倒数三个

[50,60,70]

10,20,30,40,50,60,70][-5:-3]

倒数第五个到倒数第三个(包头不包尾)

[30,40]

[10,20,30,40,50,60,70][::-1]

步长为负,从右到左反向提取

[70, 60, 50, 40, 30, 20, 10]

切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于0则会当做0,终止偏移量大于“长度-1”会被当成”长度-1”。例如:

>>> [10,20,30,40][1:30]

[20, 30, 40]

我们发现正常输出了结果,没有报错。

列表的遍历

c是列表名称

例子:遍历输出列表c的元素

复制列表所有的元素到新列表对象

如下代码实现列表元素的复制了吗?

list1 = [30,40,50]

list2 = list1

只是将list2也指向了列表对象,也就是说list2和list2持有地址值是相同的,列表对象本身的元素并没有复制。

我们可以通过如下简单方式,实现列表元素内容的复制:

d = d+c 是在d列表原有的元素上加上c列表的元素

而d = [] +c 是将d列表元素清空之后,把c列表的元素复制到d列表里,需要区分一下。

注:我们后面也会学习copy模块,使用浅复制或深复制实现我们的复制操作。

列表排序

例子:修改原列表,不建新列表的排序,sort()函数默认是升序排序

例子:降序排序sort(reverse=True)

例子:使用random模块的shuffle,随机打乱顺序

建新列表的排序

我们也可以通过内置函数sorted()进行排序,这个方法返回新列表,不对原列表做修改。降序也是一样 sorted(reverse=True)

reversed()返回迭代器

内置函数reversed()也支持进行逆序排列,与列表对象reverse()方法不同的是,内置函数reversed()不对原列表做任何修改,只是返回一个逆序排列的迭代器对象。

我们打印输出c发现提示是:list_reverseiterator。也就是一个迭代对象。同时,我们使用list(c)进行输出,发现只能使用一次。第一次输出了元素,第二次为空。那是因为迭代对象在第一次时已经遍历结束了,第二次不能再使用。

注:关于迭代对象的使用,后续章节会进行详细讲解。

列表相关的其他内置函数汇总

max和min函数

max和min函数用于返回列表中最大和最小值

例子:

sum函数

对数值型列表的所有元素进行求和操作,对非数值型列表运算则会报错。

多维列表

二维列表

一维列表可以帮助我们存储一维、线性的数据。

二维列表可以帮助我们存储二维、表格的数据。例如下表的数据:

姓名

年龄

薪资

城市

高小一

18

30000

北京

高小二

19

20000

上海

高小五

20

10000

深圳

a = [
        ["高小一",18,"3w","北京"],
	    ["高小二",19,"2w","上海"],
	    ["高小一",20,"1w","深圳"],
    ]
print(a[1][0],a[1][1],a[1][2])

内存结构图:

运行结果

如果需要一次性输出所有数据,需要用到循环

a = [
        ["高小一",18,"3w","北京"],
	    ["高小二",19,"2w","上海"],
	    ["高小一",20,"1w","深圳"],
    ]
for m in range(3):
    for n in range(4):
        print(a[m][n],end="\t")
    print() #打印完一行,换行

运行结果

元组tuple

列表属于可变序列,可以任意修改列表中的元素。元组属于不可变序列,不能修改元组中的元素。因此,元组没有增加元素、修改元素、删除元素相关的方法。

因此,我们只需要学习元组的创建和删除,元组中元素的访问和计数即可。元组支持如下操作:

1. 索引访问

2. 切片操作

3. 连接操作

4. 成员关系操作

5. 比较运算操作

6. 计数:元组长度len()、最大值max()、最小值min()、求和sum()等。

元组的创建

1. 通过()创建元组。小括号可以省略。
a = (10,20,30) 或者 a = 10,20,30

如果元组只有一个元素,则必须后面加逗号。这是因为解释器会把(1)解释为整数1,(1,)解释为元组。

例子:

2. 通过tuple()创建元组

tuple(可迭代的对象)

例如:

b = tuple() #创建一个空元组对象
b = tuple("abc")

b = tuple(range(3))

b = tuple([2,3,4])

总结:

tuple()可以接收列表、字符串、其他序列类型、迭代器等生成元组。

list()可以接收元组、字符串、其他序列类型、迭代器等生成列表。

元组的元素访问和计数

1. 元组的元素不能修改

2.元组的元素访问和列表一样,只不过返回的仍然是元组对象。

3. 列表关于排序的方法list.sorted()是修改原列表对象,元组没有该方法。如果要对元组排序,只能使用内置 函数sorted(tupleObj),并生成新的列表对象。

zip

zip(列表1,列表2,...)将多个列表对应位置的元素组合成为元组,并返回这个zip对象。

生成器推导式创建元组

从形式上看,生成器推导式与列表推导式类似,只是生成器推导式使用小括号。列表推导式直接生成列表对 象,生成器推导式生成的不是列表也不是元组,而是一个生成器对象。

我们可以通过生成器对象,转化成列表或者元组。也可以使用生成器对象的__next__()方法进行遍历,或者直 接作为迭代器对象来使用。不管什么方式使用,元素访问结束后,如果需要重新访问其中的元素,必须重新 创建该生成器对象。

例子:生成器的使用测试

元组总结

1. 元组的核心特点是:不可变序列。

2. 元组的访问和处理速度比列表快。

3. 与整数和字符串一样,元组可以作为字典的键,列表则永远不能作为字典的键使用。

字典介绍

例子1:通过{}、dict()来创建字典对象。

例子2:通过zip()创建字典对象

例子3:通过fromkeys创建值为空的字典

字典元素的访问

为了测试各种访问方法,我们这里设定一个字典对象:

 a = {'name':'gaoqi','age':18,'job':'programmer'}

  1. 通过  [键]  获得“值”。若键不存在,则抛出异常。

>>> a = {'name':'gaoqi','age':18,'job':'programmer'}

>>> a['name']

'gaoqi'

>>> a['age']

18

>>> a['sex']

Traceback (most recent call last):

  File "<pyshell#374>", line 1, in <module>

    a['sex']

KeyError: 'sex'

  1. 通过get()方法获得“值”。推荐使用。优点是:指定键不存在,返回None;也可以设定指定键不存在时默认返回的对象。推荐使用get()获取“值对象”。

>>> a.get('name')

'gaoqi'

>>> a.get('sex')

>>> a.get('sex','一个男人')

'一个男人'

  1. 列出所有的键值对

>>> a.items()

dict_items([('name', 'gaoqi'), ('age', 18), ('job', 'programmer')])

  1. 列出所有的键,列出所有的值

>>> a.keys()

dict_keys(['name', 'age', 'job'])

>>> a.values()

dict_values(['gaoqi', 18, 'programmer'])

  1. len() 键值对的个数
  2. 检测一个“键”是否在字典中

>>> a = {"name":"gaoqi","age":18}

>>> "name" in a

True

字典元素添加、修改、删除

  1. 给字典新增“键值对”。如果“键”已经存在,则覆盖旧的键值对;如果“键”不存在,则新增“键值对”。

>>>a = {'name':'gaoqi','age':18,'job':'programmer'}

>>> a['address']='西三旗1号院'

>>> a['age']=16

>>> a

{'name': 'gaoqi', 'age': 16, 'job': 'programmer', 'address': '西三旗1号院'}

  1. 使用update()将新字典中所有键值对全部添加到旧字典对象上。如果key有重复,则直接覆盖。

>>> a = {'name':'gaoqi','age':18,'job':'programmer'}

>>> b = {'name':'gaoxixi','money':1000,'sex':'男的'}

>>> a.update(b)

>>> a

{'name': 'gaoxixi', 'age': 18, 'job': 'programmer', 'money': 1000, 'sex': '男的'}

  1. 字典中元素的删除,可以使用del()方法;或者clear()删除所有键值对;pop()删除指定键值对,并返回对应的“值对象”;

>>> a = {'name':'gaoqi','age':18,'job':'programmer'}

>>> del(a['name'])

>>> a

{'age': 18, 'job': 'programmer'}

>>> b = a.pop('age')

>>> b

18

  1. popitem() :随机删除和返回该键值对。字典是“无序可变序列”,因此没有第一个元素、最后一个元素的概念;popitem弹出随机的项,因为字典并没有"最后的元素"或者其他有关顺序的概念。若想一个接一个地移除并处理项,这个方法就非常有效(因为不用首先获取键的列表)。

>>> a = {'name':'gaoqi','age':18,'job':'programmer'}

>>> a.popitem()

('job', 'programmer')

>>> a

{'name': 'gaoqi', 'age': 18}

>>> a.popitem()

('age', 18)

>>> a

{'name': 'gaoqi'}

序列解包

序列解包可以用于元组、列表、字典。序列解包可以让我们方便的对多个变量赋值。

>>> x,y,z=(20,30,10)

>>> x

20

>>> y

30

>>> z

10

>>> (a,b,c)=(9,8,10)

>>> a

9

>>> [a,b,c]=[10,20,30]

>>> a

10

>>> b

20

序列解包用于字典时,默认是对“键”进行操作; 如果需要对键值对操作,则需要使用items();如果需要对“值”进行操作,则需要使用values();

>>> s = {'name':'gaoqi','age':18,'job':'teacher'}

>>> name,age,job=s                    #默认对键进行操作

>>> name

'name'

>>> name,age,job=s.items()        #对键值对进行操作

>>> name

('name', 'gaoqi')

>>> name,age,job=s.values()             #对值进行操作

>>> name

'gaoqi'

表格数据使用字典和列表存储,并实现访问

姓名

年龄

薪资

城市

高小一

18

30000

北京

高小二

19

20000

上海

高小五

20

10000

深圳

源代码(mypy_09.py):

r1 = {"name":"高小一","age":18,"salary":30000,"city":"北京"}

r2 = {"name":"高小二","age":19,"salary":20000,"city":"上海"}

r3 = {"name":"高小五","age":20,"salary":10000,"city":"深圳"}

tb = [r1,r2,r3]

#获得第二行的人的薪资

print(tb[1].get("salary"))

#打印表中所有的的薪资

for i in range(len(tb)):   # i -->0,1,2

    print(tb[i].get("salary"))

#打印表的所有数据

for i in range(len(tb)):

    print(tb[i].get("name"),tb[i].get("age"),tb[i].get("salary"),tb[i].get("city"))

字典核心底层原理(重要)

字典对象的核心是散列表。散列表是一个稀疏数组(总是有空白元素的数组),数组的每个单元叫做bucket。每个bucket有两部分:一个是键对象的引用,一个是值对象的引用。

由于,所有bucket结构和大小一致,我们可以通过偏移量来读取指定bucket。

将一个键值对放进字典的底层过程

>>> a = {}

>>> a["name"]="gaoqi"

假设字典a对象创建完后,数组长度为8:

我们要把”name”=”gaoqi”这个键值对放到字典对象a中,首先第一步需要计算键”name”的散列值。Python中可以通过hash()来计算。

>>> bin(hash("name"))

'-0b1010111101001110110101100100101'

由于数组长度为8,我们可以拿计算出的散列值的最右边3位数字作为偏移量,即“101”,十进制是数字5。我们查看偏移量5,对应的bucket是否为空。如果为空,则将键值对放进去。如果不为空,则依次取右边3位作为偏移量,即“100”,十进制是数字4。再查看偏移量为4的bucket是否为空。直到找到为空的bucket将键值对放进去。流程图如下:

 

扩容

python会根据散列表的拥挤程度扩容。“扩容”指的是:创造更大的数组,将原有内容拷贝到新数组中。

接近2/3时,数组就会扩容。

根据键查找“键值对”的底层过程

我们明白了,一个键值对是如何存储到数组中的,根据键对象取到值对象,理解起来就简单了。

>>> a.get("name")

'gaoqi'

当我们调用a.get(“name”),就是根据键“name”查找到“键值对”,从而找到值对象“gaoqi”。

第一步,我们仍然要计算“name”对象的散列值:

>>> bin(hash("name"))

'-0b1010111101001110110101100100101'

和存储的底层流程算法一致,也是依次取散列值的不同位置的数字。 假设数组长度为8,我们可以拿计算出的散列值的最右边3位数字作为偏移量,即“101”,十进制是数字5。我们查看偏移量5,对应的bucket是否为空。如果为空,则返回None。如果不为空,则将这个bucket的键对象计算对应散列值,和我们的散列值进行比较,如果相等。则将对应“值对象”返回。如果不相等,则再依次取其他几位数字,重新计算偏移量。依次取完后,仍然没有找到。则返回None。流程图如下:

用法总结:

  1. 键必须可散列
    1. 数字、字符串、元组,都是可散列的。
    2. 自定义对象需要支持下面三点:
      • 支持hash()函数
      • 支持通过__eq__()方法检测相等性。
      • 若a==b为真,则hash(a)==hash(b)也为真。
  2. 字典在内存中开销巨大,典型的空间换时间。
  3. 键查询速度很快
  4. 往字典里面添加新建可能导致扩容,导致散列表中键的次序变化。因此,不要在遍历字典的同时进行字典的修改。
  5. 集合创建和删除

    1.使用{}创建集合对象,并使用add()方法添加元素

    2. 使用set(),将列表、元组等可迭代对象转成集合。如果原来数据存在重复数据,则只保留一个。

    3. remove()删除指定元素;clear()清空整个集合

    集合相关操作

    像数学中概念一样,Python对集合也提供了并集、交集、差集等运算。我们给出示例:

    >>> a = {1,3,'sxt'}

    >>> b = {'he','it','sxt'}

    >>> a|b #并集

    {1, 3, 'sxt', 'he', 'it'}

    >>> a&b #交集

    {'sxt'}

    >>> a-b #差集

    {1, 3}

    >>> a.union(b) #并集

    {1, 3, 'sxt', 'he', 'it'}

    >>> a.intersection(b) #交集

    {'sxt'}

    >>> a.difference(b) #差集

    {1, 3}

今天的Python学习到此结束,各位学习完有收获的话,请点赞+关注哦!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

54Allen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值