1. 列表
列表是 Python 最常用的数据类型,它是有序元素的集合,元素之间以逗号分隔,用中括号括起来,可以是任何数据类型。同时它也是一种序列,支持索引、切片、加、乘和成员检查等。
- **数组:**数据类型必须一致,有序的元素序列。
- **列表:**Python 中没有数组的概念,列表是一种特殊的数组,不要求数据类型一致,在内存中存储方式类似于链表。
**索引:**即序列中元素的位置,从 0 开始
1.1 基本操作
1. 创建列表
>>> L = [] # 创建一个空列表
>>> L = [3, '2', 6]
2. 获取元素
获取元素有三种方法,分别是:
- 通过索引获取
- 列表切片获取(获得列表)
- for 循环
>>> L = [3, '2', 6]
>>> L[1] # 索引
'2'
>>> L[0:2] # 切片
[3, '2']
>>> for i in L: # for 循环
... print(i)
...
3
2
6
3. 删除元素
del 语句可以删除整个列表,也可以用来删除某个元素:
>>> L = [3, '2', 6]
>>> del L[1] # 删除索引为 1 的元素
>>> L
[3, 6]
>>> del L[0:1] # 切片删除
>>> L
[6]
>>> del L # 删除整个列表
4. 修改列表
列表修改,可以通过索引赋值修改,也可以通过切片修改:
>>> l = [3, '2', 6]
>>> l[1] = 4 # 通过索引赋值操作
>>> l
[3, 4, 6]
>>> l[0:2] = [4, 5] # 切片修改
>>> l
[4, 5, 6]
5. 成员运算
列表支持 in、not in 成员运算,返回布尔值:
>>> l = [10, 22, 33, 66]
>>> 10 in l
True
>>> 22 not in l
False
6. 获取列表中列表中的元素
列表支持多级索引:
>>> l = [10, 22, [33, 44], 66]
>>> l[2][1]
44
7. 类型转换
通过 list()函数可以将其他数据类型转换为列表,需要注意的是 数字不能转换为列表,因为数字不是可迭代对象。
>>> list('123')
['1', '2', '3']
>>> list({'name':'rose', 'age':18})
['name', 'age']
列表转换为字符串:
>>> l = ['abc', '123'] # 列表中只有字符串时,使用 .join()方法
>>> ''.join(l)
'abc123'
>>> l = ['abc', 123] # 当列表中有数字时
>>> s = ''
>>> for i in l:
... s += str(i)
...
>>> print(s)
abc123
8. 切片(slice)
列表是有序元素的集合,支持切片操作,slice(start,stop[,step])
有三个参数,开始结束位置以及步长。切片是对原列表的浅拷贝,不改变原列表。
>>> l = [10, 22, 33, 66]
>>> l[0:2] # 包含开始位置,不包含结束位置
[10, 22]
>>> l[:3] # 省略开始位置
[10, 22, 33]
>>> l[2:] # 省略结束位置
[33, 66]
>>> l[:] # 对原列表拷贝(副本)
[10, 22, 33, 66]
>>> l[:3:2] # 步长为 2
[10, 33]
>>> l[::2] # 对原列表拷贝,步长为 2
[10, 33]
>>> l[::-1] # 反转列表
[66, 33, 22, 10]
1.2 列表内置方法
# append(obj):在列表最后添加一个元素
>>> l = [2, 3]
>>> l.append(6)
>>> l
[2, 3, 6]
# clear():清空列表中所有元素
>>> l = [2, 3]
>>> l.clear()
>>> l
[]
# copy():浅拷贝
>>> l = [2, 3]
>>> l1 = l.copy()
>>> l1
[2, 3]
# count(value):统计列表中某个元素的个数
>>> l = ['a', 'b', 'c', 'a']
>>> l.count('a')
2
# extend(iterable):往列表最后添加多给元素,参数必须是可迭代对象
>>> l = ['a', 'b', 'c', 'a']
>>> l.extend('12')
>>> l.extend([3, 5])
>>> l
['a', 'b', 'c', 'a', '1', '2', 3, 5]
# index(value,start=None,end=None):查找某个元素的位置,可指定范围,当有多个时,仅返回第一个的位置
>>> l = ['a', 'b', 'c', 'a', '1', '2', 3, 5] # 若不存在报 ValueError
>>> l.index('a')
0
# insert(index,value):往列表中任意位置插入一个元素,第一个为插入位置,第二个为插入元素
>>> l = ['a', 'b']
>>> l.insert(1, 2)
>>> l
['a', 2, 'b']
# pop(index=None):删除一个元素,并获得它,默认是最后一个,可以指定索引
>>> l = ['a', 'b', 'c']
>>> res = l.pop()
>>> res
'c'
>>> l
['a', 'b']
>>> l.pop(1)
'b'
>>> l
['a']
# remove(value):删除一个元素,当有多个时,仅删除第一个
>>> l = ['a', 'b', 'c', 'a']
>>> l.remove('a')
>>> l
['b', 'c', 'a']
# reverse():列表反转
>>> l = ['a', 'b', 'c', 'a']
>>> l.reverse()
>>> l
['a', 'c', 'b', 'a']
# sort(func,key=None,reverse=True):对列表中的元素进行排序,func 为排序算法(默认从小到大),key 为关键字,reverse=False 表示不颠倒顺序,True 表示从大到小
>>> l = [22, 11, 33, 10]
>>> l.sort()
>>> l
[10, 11, 22, 33]
>>> l.sort(reverse=True)
>>> l
[33, 22, 11, 10]
2. 元组
元组是一种特殊的列表,也是一种有序元素的集合,与列表的区别:
- **列表:**可以修改、增加、删除,使用中括号括起来
- **元组:**一旦创建不可修改、增加、删除,使用小括号括起来
2.1 基本操作
1. 创建
一般在创建元组时,推荐在最后一个元素加一个逗号【,】
>>> temp = ()
>>> temp = (3,)
>>> temp = (2, 3, 'ab',)
2. 获取
元组获取元素与列表一样,同样地可以通过索引、切片以及 for 循环遍历获取。其他数据类型转换为元组,使用 tuple()函数,方法与 list()一样。
>>> temp = (2, 3, 'ab')
>>> temp[1]
3
>>> temp[0:2]
(2, 3)
>>> for i in temp:
... print(i)
2
3
ab
3. 更新
元组一旦创建,其一级元素不可被修改,但是元组里面的二级元素(如 元组中的列表中的元素)可以被修改。
>>> temp = (2, 3, ['a', 'b'], 4)
>>> temp[2][0] = 'c'
>>> temp
(2, 3, ['c', 'b'], 4)
另外还可以类似于 str 一样,使用连接符 + 对其进行间接修改。但是需要注意的是,使用连接符修改将会产生一个新的元组(即验证了元组不可被修改)。
>>> temp = (2, 3, 4)
>>> id(temp)
47622040
>>> temp = temp[:2] + (5,) + temp[2:] # 在索引为 2 的位置插入一个元素 5
>>> temp
(2, 3, 5, 4)
>>> id(temp) # 前后元组名相同,但 id 不同,不是一个元组
39030600
4. 删除
一般情况,元组不使用时,将会被 Python 的回收机制自动删除,因此不用特意删除。
>>> temp = (2, 3, 4)
>>> temp = temp[:1] + temp[2:]
>>> temp
(2, 4)
>>> del temp # 删除整个元组
2.2 内置函数
# len(obj):获取元组长度
>>> temp = (2, 3, 4)
>>> len(temp)
3
# max、min(obj):获取元组中元组最大、小值
>>> max(temp)
4
>>> min(temp)
2
# tuple():类型转换
>>> tuple('123'
... )
('1', '2', '3')
>>> tuple({'name':'rose', 'age':18})
('name', 'age')
2.3 内置方法
# count(value):统计某个元素个数
>>> temp = (2, 3, 4, 2)
>>> temp.count(2)
2
# index(value,start=None,end=None):获取某个元素位置,若不存在,报 ValueError
>>> temp.index(2, 0, 3)
0
2.4 元祖拆包
元组拆包即将元组中的元素平行赋值给变量。
>>> x,y,z = (1,2,3)
>>> print(x,y,z)
1 2 3
>>> infos = [(1,2,3), (4,5,6)]
>>> for i in infos:
... print('%s %s %s'%i)
...
1 2 3
4 5 6
3. 字典
字典是一种可变容器模型,可以存储任意类型对象。由无序的键(key)值(value)对组成,每对之间以逗号分割,最外层以花括号包裹。
- **键:**任意不可变类型(int、str、tuple 等),必须是唯一的。
- **值:**任意类型
3.1 基本操作
1. 创建
>>> d1 = {}
>>> d2 = {'name': 'rose', 'age': 18}
>>> d3 = dict()
2. 访问
因为字典是无序的,所有只能通过 key 来访问 value:
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2['name'] # 这种方法,当 key 不存在是会报 KeyError
'rose'
>>> d2.get('age')
18
3. 删除
del 语句可以用来删除一个元素,也可用于删除整个字典:
>>> d2 = {'name': 'rose', 'age': 18}
>>> del d2['name'] # 删除 name
>>> d2
{'age': 18}
>>> del d2 # 删除整个字典
4. 修改
通过 key 访问到 value,对其进行赋值,便可完成修改:
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2['name'] = 'tom'
>>> d2
{'name': 'tom', 'age': 18}
3.2 内置方法
PART 1
# fromkeys(sequence[, value]):内置的类方法 @staticmethod,接收一个序列,将序列中的元素作为键,value 默认为 None,返回一个新的字典
>>> d = dict.fromkeys(['a', 'b'], 2)
>>> d
{'a': 2, 'b': 2}
# get(key[, value]):根据 key 获取 value,即使 key 不存在也不会报错,若 key 存在可以指定返回值
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2.get('age')
18
>>> d2.get('gender', '没找到')
'没找到'
# pop(key[,default]):根据 key 删除一个元素,若 key 在字典中,将其删除并返回。否则返回默认值,如果 key 不存在,且又未指定默认值,引发 KeyError
>>> d2 = {'name': 'rose', 'age': 18}
>>> s = d2.pop('name')
>>> s
'rose'
>>> d2.pop('gender', "don't find")
"don't find"
>>> d2.pop('gender') # key 不存在,且又未指定默认值,引发 KeyError
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'gender'
# popitem():从字典中随意删除一个元素,并返回
>>> d2 = {'name': 'rose', 'age': 18}
>>> s = d2.popitem()
>>> s
('age', 18)
>>> d2
{'name': 'rose'}
# setdefault(key[,default]):设置字典键值对,若存在,不设置,并获取当前 key 对应的 value。若不存在,设置
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2.setdefault('gender', 'male')
'male'
>>> d2.setdefault('age', 19)
18
>>> d2
{'name': 'rose', 'age': 18, 'gender': 'male'}
# update(**kwargs):更新字典
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2.update(age=20, gender='male') # 若 key 存在,在更新,若不存在则新建键值对
>>> d2
{'name': 'rose', 'age': 20, 'gender': 'male'}
>>> d2.update({'a':20}) # 传入一个字典
>>> d2
{'name': 'rose', 'age': 18, 'a': 20}
PART 2
# keys():返回字典的 key
>>> d2 = {'name': 'rose', 'age': 18}
>>> k = d2.keys()
>>> k
dict_keys(['name', 'age'])
>>> for i in k:
... print(i)
...
name
age
# values(): 返回字典的 value
>>> v = d2.values()
>>> v
dict_values(['rose', 18])
>>> for i in v:
... print(i)
...
rose
18
# items():返回字典的 key、value
>>> for k, v in d2.items():
... print(k, v)
...
name rose
age 18
# clear():清空整个字典里的元组
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2.clear()
>>> d2
{}
# copy():对字典进行浅拷贝
>>> d2 = {'name': 'rose', 'age': 18}
>>> d = d2.copy()
>>> d
{'name': 'rose', 'age': 18}
4. 集合
由不同元素组成的无序集合,里面的元素必须是不可变的,且每个元素都是唯一的。
- 无序,不能用索引方式访问
- 只能是数字、字符串、元组等不可变数据
4.1 基本操作
1. 创建
创建一个集合有两种方法:一是直接用大括号把一堆元素括起来;另一种是使用 set()。
>>> s = {1, 2, 3} # 不能使用大括号直接创建一个空集合,那样会创建一个字典
>>> s = set('123')
>>> s
{'3', '1', '2'}
>>> s = {1, 2, 3, 2} # 创建一个重复的集合,会自动将重复的元素过滤
>>> s
{1, 2, 3}
2. 访问
因为集合中元素是无序的,所以不能通过索引访问,只能用 for 循环每个元素,或成员运算符判断元素是否在集合中。
>>> s = {'3', '1', '2'}
>>> for i in s:
... print(i)
...
3
1
2
>>> '3' in s
True
3. 转换类型
不能将数字和字典转换为集合。
>>> set([1,2,3])
{1, 2, 3}
>>> set('123')
{'3', '1', '2'}
4.2 内置方法
# add(*args, **kwargs):添加一个元素
>>> s = {1, 2, 3}
>>> s.add(4)
>>> s
{1, 2, 3, 4}
# clear():清空集合
>>> s = {1, 2, 3}
>>> s.clear()
>>> s
set()
# copy():浅拷贝
>>> s = {1, 2, 3}
>>> s1 = s.copy()
>>> s1
{1, 2, 3, 4}
# pop():随机移除一个元素
>>> s1 = {1, 2, 3}
>>> s1.pop()
1
>>> s1
{2, 3}
# remove(value):删除某个指定元素,若元素不存在抛出 KeyError
>>> s1 = {1, 2, 3}
>>> s1.remove(2)
>>> s1
{1, 3}
# discard(value):与 remove()一样都是删除某个元素,但是元素不存在不会报错
>>> s1 = {1, 2, 3}
>>> s1.discard(4)
# difference_update(set2):更新集合,相当于 s1 = s1 - s2
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.difference_update(s2)
>>> s1
{1}
# intersection_update(set2):求交集,与 intersection()不同的是它不会改变原集合,而 intersection()返回新的集合
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.intersection(s2)
{2, 3}
>>> s1
{1, 2, 3}
# set1.isdisjoint(set2):判断两个集合有无交集,有交集返回 False
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.isdisjoint(s2)
False
# s1.issubset(set2):判断 set1 是否是 set2 的子集(即 set1 <= set2)
# set1.issuperset(set2):判断 set1 是否是 set2 的父集
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.issubset(s2)
False
>>> s1.issuperset(s2)
False
# set.update(set2):给集合添加元素,参数可以是集合、字符串、列表、元组、字典等
>>> s1 = {1, 2, 3}
>>> s1.update({'a':'b'}) # 字典
>>> s1
{1, 2, 3, 'a'}
>>> s1.update([4, 5]) # 列表
>>> s1.update({6, 7}) # 集合
>>> s1
{1, 2, 3, 4, 5, 6, 7, 'a'}
# set1.symmetric_difference_update(set2):求交叉补集,在原集合上更新,将不重复的元素添加到原集合中
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.symmetric_difference_update(s2)
>>> s1
{1, 4}
不可变集合
有时想要像元组一样不能随意添加、删除集合元素,可以使用 frozenset()函数定义一个不可变集合。
>>> s1 = frozenset({1, 2, 3})
>>> s1.add(4)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'frozenset' object has no attribute 'add'
4.3 集合关系运算
1. 交集(&)
交集即两个集合重复的部分,intersection()方法可以用来求两个集合的交集,并返回交集,不改变原集合。
set1.intersection(set2)
set1 & set2
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.intersection(s2)
{2, 3}
>>> s1
{1, 2, 3}
>>> s1 & s2
{2, 3}
2. 并集(|)
并集即将两个集合的所有元素并在一起,重复的只出现一次,可以用作简单去重。
set1.union(set2)
set1 | set2
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.union(s2)
{1, 2, 3, 4}
>>> s1 | s2
{1, 2, 3, 4}
3. 差集(-)
差集即 set1 - set2
,两个集合中重复的元素去掉,仅包含第一个集合中剩余的元素,不包含第二个集合剩余的元素,不改变原集合。
set1.difference(set2)
set1 - set2
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.difference(s2)
{1}
>>> s1 - s2
{1}
>>> s1
{1, 2, 3}
4. 交叉补集(^)
交叉补集即两个集合不重复的元素,不改变原集合。
set1.symmetric_difference(set2)
set1 ^ set2
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.symmetric_difference(s2)
{1, 4}
>>> s1
{1, 2, 3}
>>> s1 ^ s2
{1, 4}
5. 去重
可以利用集合对列表进行简单去重,先将其转换为集合,再转换为列表,需要注意的是,元素顺序将会改变。
>>> names = ['rose', 'lila', 'tom', 'rose']
>>> names = list(set(names))
>>> names
['lila', 'tom', 'rose']
5. 序列
序列即有序元素集合,是可迭代对象,包括字符串、列表、元组,它们之间用很多共同点:
-
都可以通过索引获取值,即是有序(索引从 0 开始)
-
可以切片
-
有共同的操作符(重复、拼接、成员关系操作符等)
enumerate()方法
enumerate(iterable)方法用于生成一个二元组(二元组即元素数量为二的元组)构成的一个可迭代对象,每个二元组由可迭代索引与对应元素组成。
>>> s = 'abc'
>>> for i in enumerate(s):
... print(i)
...
(0, 'a')
(1, 'b')
(2, 'c')
6. 练习
字典无限嵌套
cities={
'北京':{
'朝阳':['国贸','CBD','天阶','我爱我家','链接地产'],
'海淀':['圆明园','苏州街','中关村','北京大学'],
'昌平':['沙河','南口','小汤山',],
'怀柔':['桃花','梅花','大山'],
'密云':['密云A','密云B','密云C']
},
'河北':{
'石家庄':['石家庄A','石家庄B','石家庄C','石家庄D','石家庄E'],
'张家口':['张家口A','张家口B','张家口C'],
'承德':['承德A','承德B','承德C','承德D']
}
}
for i in cities['北京']:
print(i)
朝阳
海淀
昌平
怀柔
密云
for i in cities['北京']['海淀']:
print(i)
圆明园
苏州街
中关村
北京大学