Python入门序列(列表,元组,字典,集合)

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/gcxzflgl/article/details/83446331

序列

序列是一种数据存储方式,用来存储一系列的数据。在内存中,序列就是一块用来存放多个值的连续的内存空间。比如一个整数序列[10,20,30,40],可以这样示意表示:


由于 Python3 中一切皆对象,在内存中实际是按照如下方式存储的:
a = [10,20,30,40]


从图示中,我们可以看出序列中存储的是整数对象的地址,而不是整数对象的值。python
中常用的序列结构有:字符串、列表、元组、字典、集合

列表简介
列表:用于存储任意数目、任意类型的数据集合。
列表是内置可变序列,是包含多个元素的有序连续的内存空间。列表定义的标准语法格式:
a = [10,20,30,40]其中,10,20,30,40 这些称为:列表 a 的元素。
列表中的元素可以各不相同,可以是任意类型。比如:a = [10,20,'abc',True]

Python 的列表大小可变,根据需要随时增加或缩小。
字符串和列表都是序列类型,一个字符串是一个字符序列,一个列表是任何元素的序列

基本语法[]创建

list()创建 range()创建
使用 list()可以将任何可迭代的数据转化成列表。range()可以帮助我们非常方便的创建整数列表,语法格式为:
range([start,] end [,step])

append()方法

原地修改列表对象,是真正的列表尾部添加新的元素,速度最快,推荐使用。

 

+运算符操作
并不是真正的尾部添加元素, 而是创建新的列表对象; 将原列表的元素和新列表的元素依次
复制到新的列表对象中。这样,会涉及大量的复制操作,对于操作大量元素不建议使用。

通过如上测试,我们发现变量 a 的地址发生了变化。也就是创建了新的列表对象。

extend()方法
将目标列表的所有元素添加到本列表的尾部,属于原地操作,不创建新的列表对象。

insert()插入元素
使用 insert()方法可以将指定的元素插入到列表对象的任意制定位置。这样会让插入位置后面所有的元素进行移动,会影响处理速度。涉及大量元素时,尽量避免使用。类似发生这种移动的函数还有:remove()、pop()、del(),它们在删除非尾部元素时也会发生操作位置后面元素的移动。

del 删除
删除列表指定位置的元素。

pop()方法
pop()删除并返回指定位置元素,如果未指定位置则默认操作列表最后一个元素。

remove()方法
删除首次出现的指定元素,若不存在该元素抛出异常。

通过索引直接访问元素
可以通过索引直接访问元素。 索引的区间在[0, 列表长度-1]这个范围。 超过这个范围则会抛出异常。

index()获得指定元素在列表中首次出现的索引
index()可以获取指定元素首次出现的索引位置。 语法是: index(value,[start,[end]])。 其中,start 和 end 指定了搜索的范围。

count()获得指定元素在列表中出现的次数
count()可以返回指定元素在列表中出现的次数。

成员资格判断
判断列表中是否存在指定的元素,我们可以使用 count()方法,返回 0 则表示不存在,返回大于 0 则表示存在。但是,一般我们会使用更加简洁的 in 关键字来判断,直接返回 True或 False。

切片操作
在前面字符串章节,提到过字符串的切片操作,对于列表的切片操作和字符串类似。
切片是 Python 序列及其重要的操作,适用于列表、元组、字符串等等。切片的格式如下:
切片 slice 操作可以让我们快速提取子列表或修改。标准格式为:[起始偏移量 start:终止偏移量 end[:步长 step]]
注:当步长省略时顺便可以省略第二个冒号

切片操作时,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不会报错。起始偏移量小于 0 则会当做 0,终止偏移量大于“长度-1”会被当成”长度-1”

列表排序
修改原列表,不建新列表的排序

建新列表的排序
我们也可以通过内置函数 sorted()进行排序,这个方法返回新列表,不对原列表做修改。

reversed()返回迭代器
内置函数 reversed()也支持进行逆序排列,与列表对象 reverse()方法不同的是,内置函数
reversed()不对原列表做任何修改,只是返回一个逆序排列的迭代器对象。

打印输出 b 发现提示是:list_reverseiterator。也就是一个迭代对象。同时,我们使用list(b)进行输出,发现只能使用一次。第一次输出了元素,第二次为空。那是因为迭代对象在第一次时已经遍历结束了,第二次不能再使用。(类似游标指针)

列表相关的其他内置函数汇总

 

 

 

元组 tuple
列表属于可变序列,可以任意修改列表中的元素。元组属于不可变序列,不能修改元组中的
元素。因此,元组没有增加元素、修改元素、删除元素相关的方法。

元组的创建
通过()创建元组。小括号可以省略。
a = (10,20,30)或者a = 10,20,30
如果元组只有一个元素, 则必须后面加逗号。 这是因为解释器会把(1)解释为整数 1, (1,)解释为元组。

 通过 tuple()创建元组 tuple(可迭代的对象)

总结:
tuple()可以接收列表、字符串、其他序列类型、迭代器等生成元组。
list()可以接收元组、字符串、其他序列类型、迭代器等生成列表。

元组的元素访问和计数
1. 元组的元素不能修改

列表关于排序的方法 list.sorted()是修改原列表对象,元组没有该方法。如果要对元组排
序,只能使用内置函数 sorted(tupleObj)

zip
zip(列表 1,列表 2,...)将多个列表对应位置的元素组合成为元组,并返回这个 zip 对象。

元组总结
1. 元组的核心特点是:不可变序列。
2. 元组的访问和处理速度比列表快。
3. 与整数和字符串一样,元组可以作为字典的键,列表则永远不能作为字典的键使用。

 

 

字典介绍
字典是“键值对”的无序可变序列,字典中的每个元素都是一个“键值对”,包含: “键对象”和“值对象”。可以通过“键对象”实现快速获取、删除、更新对应的“值对象”。列表中我们通过“下标数字”找到对应的对象。字典中通过“键对象”找到对应的“值对象”。“键”是任意的不可变数据,比如:整数、浮点数、字符串、元组。但是:列表、字典、集合这些可变对象,不能作为“键”。并且“键”不可重复。“值”可以是任意的数据,并且可重复。一个典型的字典的定义方式:a = {'name':'gaoqi','age':18,'job':'programmer'}
字典的创建
1. 我们可以通过{}、dict()来创建字典对象。

2. 通过 zip()创建字典对象

3. 通过 fromkeys 创建值为空的字典

字典元素的访问

 1.通过[键]获得“值”。若键不存在,则抛出异常。

2. 通过 get()方法获得“值”。推荐使用。优点是:指定键不存在,返回 None;也可以设
定指定键不存在时默认返回的对象。推荐使用 get()获取“值对象”。

 3.列出所有的键值对

字典元素添加、修改、删除

1. 给字典新增“键值对”。如果“键”已经存在,则覆盖旧的键值对;如果“键”不存在,则新增“键值对”

2. 使用 update()将新字典中所有键值对全部添加到旧字典对象上。如果 key 有重复,则直接覆盖。

3. 字典中元素的删除,可以使用 del()方法;或者 clear()删除所有键值对;pop()删除指定键值对,并返回对应的“值对象”

4.popitem() :随机删除和返回该键值对。字典是“无序可变序列”,因此没有第一个元素、最后一个元素的概念;popitem 弹出随机的项,因为字典并没有"最后的元素"或者其他有关顺序的概念。若想一个接一个地移除并处理项,这个方法就非常有效(因为不用首先获取键的列表)。

序列解包
序列解包可以用于元组、列表、字典。序列解包可以让我们方便的对多个变量赋值.序列解包用于字典时,默认是对“键”进行操作; 如果需要对键值对操作,则需要使用items();如果需要对“值”进行操作,则需要使用 values()

 

字典核心底层原理(重要)
字典对象的核心是散列表。散列表是一个稀疏数组(总是有空白元素的数组),数组的每个单元叫做 bucket。每个 bucket 有两部分:一个是键对象的引用,一个是值对象的引用。由于所有 bucket 结构和大小一致,我们可以通过偏移量来读取指bucket。

将一个键值对放进字典的底层过程

假设字典 a 对象创建完后,数组长度为 7:

我要把”name”=”gaochenxi”这个键值对放到字典对象 a 中,第一步需要计算键”name”的散列值。Python 中通过 hash()来计算。

由于数组长度为 7,我们可以拿计算出的散列值的最右边 3 位数字作为偏移量,即“000”,十进制是数字 0。我们查看偏移量 0,对应的 bucket 是否为空。如果为空,则将键值对放进去。如果不为空,则依次取右边 3 位作为偏移量,即“010”,十进制是数字
2。再查看偏移量为 2 的 bucket 是否为空。直到找到为空的 bucket 将键值对放进去。流程图如下:

扩容
python 会根据散列表的拥挤程度扩容。“扩容”指的是:创造更大的数组,将原内容拷贝到新数组中。接近 2/3 时,数组就会扩容。

根据键查找“键值对”的底层过程

当我们调用 a.get(“name”),就是根据键“name”查找到“键值对”,从而找到值对象“gaochenxi”。
第一步,我们仍然要计算“name”对象的散列值:

和存储的底层流程算法一致,也是依次取散列值的不同位置的数字。 假设数组长度为7,我们可以拿计算出的散列值的最右边 3 位数字作为偏移量,即“00”,十进制是数字0。我们查看偏移量 0,对应的 bucket 是否为空。如果为空,则返回 None。如果不为空,则将这个 bucket 的键对象计算对应散列值,和我们的散列值进行比较,如果相等。则将对应“值对象”返回。如果不相等,则再依次取其他几位数字,重新计算偏移量。依次取完后,仍然没有找到。则返回 None。流程图如下:

用法总结:
1. 键必须可散列
    (1) 数字、字符串、元组,都是可散列的。
    (2) 自定义对象需要支持下面三点:
         1支持 hash()函数
         2支持通过__eq__()方法检测相等性。
         3若 a==b 为真,则 hash(a)==hash(b)也为真。
2. 字典在内存中开销巨大,典型的空间换时间。
3. 键查询速度很快
4. 往字典里面添加新建可能导致扩容,导致散列表中键的次序变化。因此,不要在遍历字典的同时进行字典的修改。

 

 

集合
集合是无序可变元素不能重复。实际上集合底层是字典实现,集合的所有元素都是字典中的“键对象”,因此是不能重复的且唯一

集合创建和删除

1. 使用{}创建集合对象,并使用 add()方法添加元素

2. 使用 set(),将列表、元组等可迭代对象转成集合。如果原来数据存在重复数据,则只保留一个。

3. remove()删除指定元素;clear()清空整个集合

集合相关操作,像数学中概念一样,Python 对集合也提供了并集、交集、差集等运算。给出示例:

推导式创建序列
推导式是从一个或者多个迭代器快速创建序列的一种方法。它可以将循环和条件判断结合,从而避免冗长的代码。推导式是典型的 Python 风格


列表推导式
列表推导式生成列表对象,语法如下:
       [表达式foritemin 可迭代对象 ]或者:{表达式foritemin 可迭代对象if条件判断}
>>> [x for x in range(1,5)]
[1, 2, 3, 4]
>>> [x*2 for x in range(1,5)]
[2, 4, 6, 8]
>>> [x*2 for x in range(1,20) if x%5==0 ]
[10, 20, 30]
>>> [aforain "abcdefg"]
['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> cells = [(row,col) forrow in range(1,10) for col in range(1,10)]#可以使用两个循环
>>> for cell in cells:
print(cell)


字典推导式
字典的推导式生成字典对象,格式如下:
{key_expression:value_expressionfor表达式in可迭代对象}类似于列表推导式,字典推导也可以增加 if 条件判断、多个 for 循环。
统计文本中字符出现的次数:
>>> my_text = ' i love you, i love china, i love gao'
>>> char_count = {c:my_text.count(c)for c in my_text}
>>> char_count
{' ': 9, 'i': 4, 'l': 3, 'o': 5, 'v': 3, 'e': 3, 'y': 1, 'u': 1, ',': 2, 'h': 1, 'n': 1, 'c': 1, 'g': 1, 'a': 2}


集合推导式
集合推导式生成集合,和列表推导式的语法格式类似:
{表达式foritemin 可迭代对象 }或者:{表达式foritemin 可迭代对象if条件判断}
>>> {x for x in range(1,100) if x%9==0}
{99, 36, 72, 9, 45, 81, 18, 54, 90, 27, 63}


生成器推导式(生成元组)
>>> (x for x in range(1,100) if x%9==0)
<generator object <genexpr> at 0x0000000002BD3048>
我们发现提示的是“一个生成器对象”。显然,元组是没有推导式的。一个生成器只能运行一次。第一次迭代可以得到数据,第二次迭代发现数据已经没有了。
>>> gnt = (x for x in range(1,100) if x%9==0)
>>> for x in gnt:
print(x,end=' ')
9 18 27 36 45 54 63 72 81 90 99
>>> for x in gnt:
print(x,end=' ')
>>>

展开阅读全文

没有更多推荐了,返回首页