Python 基本数据类型（二）_python二级列表-CSDN博客

本文链接：https://blog.csdn.net/hj1993/article/details/129133304

本文详细介绍了Python中的列表、元组、字典和集合的基本操作，包括创建、访问、修改、删除、转换及内置方法。列表是可变的有序元素集合，支持多种操作；元组是不可变的有序元素集合；字典是无序的键值对集合，可变且唯一；集合是无序的唯一元素集合，支持交集、并集、差集和补集操作。此外，还介绍了序列的共性和enumerate方法的使用。

1. 列表

列表是 Python 最常用的数据类型，它是有序元素的集合，元素之间以逗号分隔，用中括号括起来，可以是任何数据类型。同时它也是一种序列，支持索引、切片、加、乘和成员检查等。

**数组：**数据类型必须一致，有序的元素序列。
**列表：**Python 中没有数组的概念，列表是一种特殊的数组，不要求数据类型一致，在内存中存储方式类似于链表。

**索引：**即序列中元素的位置，从 0 开始

1.1 基本操作

1. 创建列表

>>> L = []		# 创建一个空列表
>>> L = [3, '2', 6]

2. 获取元素

获取元素有三种方法，分别是：

通过索引获取
列表切片获取（获得列表）
for 循环

>>> L = [3, '2', 6]
>>> L[1]          # 索引       
'2'                      
>>> L[0:2]        # 切片
[3, '2']                 
>>> for i in L:     # for 循环     
...     print(i)         
...                      
3                        
2                        
6

3. 删除元素

del 语句可以删除整个列表，也可以用来删除某个元素：

>>> L = [3, '2', 6]
>>> del L[1]  	# 删除索引为 1 的元素
>>> L
[3, 6]
>>> del L[0:1]		# 切片删除
>>> L
[6]
>>> del L		# 删除整个列表

4. 修改列表

列表修改，可以通过索引赋值修改，也可以通过切片修改：

>>> l = [3, '2', 6]                                                 
>>> l[1] = 4            # 通过索引赋值操作            
>>> l                               
[3, 4, 6]                           
>>> l[0:2] = [4, 5]       # 切片修改	          
>>> l                               
[4, 5, 6]

5. 成员运算

列表支持 in、not in 成员运算，返回布尔值：

>>> l = [10, 22, 33, 66]
>>> 10 in l
True
>>> 22 not in l
False

6. 获取列表中列表中的元素

列表支持多级索引：

>>> l = [10, 22, [33, 44], 66]
>>> l[2][1]
44

7. 类型转换

通过 list（）函数可以将其他数据类型转换为列表，需要注意的是 数字不能转换为列表，因为数字不是可迭代对象。

>>> list('123')
['1', '2', '3']
>>> list({'name':'rose', 'age':18})
['name', 'age']

列表转换为字符串：

>>> l = ['abc', '123']		# 列表中只有字符串时，使用 .join（）方法
>>> ''.join(l)
'abc123'

>>> l = ['abc', 123]    # 当列表中有数字时				
>>> s = ''              
>>> for i in l:         
...     s += str(i)     
...                     
>>> print(s)            
abc123

8. 切片（slice）

列表是有序元素的集合，支持切片操作，slice（start，stop[，step]）有三个参数，开始结束位置以及步长。切片是对原列表的浅拷贝，不改变原列表。

>>> l = [10, 22, 33, 66]
>>> l[0:2]		# 包含开始位置，不包含结束位置
[10, 22]
>>> l[:3]		# 省略开始位置
[10, 22, 33]
>>> l[2:]		# 省略结束位置
[33, 66]
>>> l[:]		# 对原列表拷贝（副本）
[10, 22, 33, 66]
>>> l[:3:2]		# 步长为 2
[10, 33]
>>> l[::2]		# 对原列表拷贝，步长为 2
[10, 33]
>>> l[::-1]		# 反转列表
[66, 33, 22, 10]

1.2 列表内置方法

# append（obj）：在列表最后添加一个元素
>>> l = [2, 3]
>>> l.append(6)
>>> l
[2, 3, 6]

# clear（）：清空列表中所有元素
>>> l = [2, 3]
>>> l.clear()
>>> l
[]

# copy（）：浅拷贝
>>> l = [2, 3]
>>> l1 = l.copy()
>>> l1
[2, 3]

# count（value）：统计列表中某个元素的个数
>>> l = ['a', 'b', 'c', 'a']
>>> l.count('a')
2

# extend（iterable）：往列表最后添加多给元素，参数必须是可迭代对象
>>> l = ['a', 'b', 'c', 'a']
>>> l.extend('12')
>>> l.extend([3, 5])
>>> l
['a', 'b', 'c', 'a', '1', '2', 3, 5]

# index（value，start=None，end=None）：查找某个元素的位置，可指定范围，当有多个时，仅返回第一个的位置
>>> l = ['a', 'b', 'c', 'a', '1', '2', 3, 5]		# 若不存在报 ValueError
>>> l.index('a')
0

# insert（index，value）：往列表中任意位置插入一个元素，第一个为插入位置，第二个为插入元素
>>> l = ['a', 'b']
>>> l.insert(1, 2)
>>> l
['a', 2, 'b']

# pop（index=None）：删除一个元素，并获得它，默认是最后一个，可以指定索引
>>> l = ['a', 'b', 'c']
>>> res = l.pop()
>>> res
'c'
>>> l
['a', 'b']
>>> l.pop(1)
'b'
>>> l
['a']

# remove（value）：删除一个元素，当有多个时，仅删除第一个
>>> l = ['a', 'b', 'c', 'a']
>>> l.remove('a')
>>> l
['b', 'c', 'a']

# reverse（）：列表反转
>>> l = ['a', 'b', 'c', 'a']
>>> l.reverse()
>>> l
['a', 'c', 'b', 'a']

# sort（func，key=None，reverse=True）：对列表中的元素进行排序，func 为排序算法（默认从小到大），key 为关键字，reverse=False 表示不颠倒顺序，True 表示从大到小
>>> l = [22, 11, 33, 10]
>>> l.sort()
>>> l
[10, 11, 22, 33]
>>> l.sort(reverse=True)
>>> l
[33, 22, 11, 10]

2. 元组

元组是一种特殊的列表，也是一种有序元素的集合，与列表的区别：

**列表：**可以修改、增加、删除，使用中括号括起来
**元组：**一旦创建不可修改、增加、删除，使用小括号括起来

2.1 基本操作

1. 创建

一般在创建元组时，推荐在最后一个元素加一个逗号【，】

>>> temp = ()
>>> temp = (3,)
>>> temp = (2, 3, 'ab',)

2. 获取

元组获取元素与列表一样，同样地可以通过索引、切片以及 for 循环遍历获取。其他数据类型转换为元组，使用 tuple（）函数，方法与 list（）一样。

>>> temp = (2, 3, 'ab')
>>> temp[1]
3
>>> temp[0:2]
(2, 3)
>>> for i in temp:
...     print(i)
2
3
ab

3. 更新

元组一旦创建，其一级元素不可被修改，但是元组里面的二级元素（如元组中的列表中的元素）可以被修改。

>>> temp = (2, 3, ['a', 'b'], 4)
>>> temp[2][0] = 'c'
>>> temp
(2, 3, ['c', 'b'], 4)

另外还可以类似于 str 一样，使用连接符 + 对其进行间接修改。但是需要注意的是，使用连接符修改将会产生一个新的元组（即验证了元组不可被修改）。

>>> temp = (2, 3, 4)
>>> id(temp)
47622040
>>> temp = temp[:2] + (5,) + temp[2:]	# 在索引为 2 的位置插入一个元素 5
>>> temp
(2, 3, 5, 4)
>>> id(temp)		# 前后元组名相同，但 id 不同，不是一个元组
39030600

4. 删除

一般情况，元组不使用时，将会被 Python 的回收机制自动删除，因此不用特意删除。

>>> temp = (2, 3, 4)
>>> temp = temp[:1] + temp[2:]
>>> temp
(2, 4)

>>> del temp		# 删除整个元组

2.2 内置函数

# len(obj)：获取元组长度
>>> temp = (2, 3, 4)
>>> len(temp)
3

# max、min（obj）：获取元组中元组最大、小值
>>> max(temp)
4
>>> min(temp)
2

# tuple（）：类型转换
>>> tuple('123'
... )
('1', '2', '3')
>>> tuple({'name':'rose', 'age':18})
('name', 'age')

2.3 内置方法

# count（value）：统计某个元素个数
>>> temp = (2, 3, 4, 2)
>>> temp.count(2)
2

# index（value，start=None，end=None）：获取某个元素位置，若不存在，报 ValueError
>>> temp.index(2, 0, 3)
0

2.4 元祖拆包

元组拆包即将元组中的元素平行赋值给变量。

>>> x,y,z = (1,2,3)
>>> print(x,y,z)
1 2 3

>>> infos = [(1,2,3), (4,5,6)]
>>> for i in infos:
...     print('%s %s %s'%i)
...
1 2 3
4 5 6

3. 字典

字典是一种可变容器模型，可以存储任意类型对象。由无序的键（key）值（value）对组成，每对之间以逗号分割，最外层以花括号包裹。

**键：**任意不可变类型（int、str、tuple 等），必须是唯一的。
**值：**任意类型

3.1 基本操作

1. 创建

>>> d1 = {}
>>> d2 = {'name': 'rose', 'age': 18}
>>> d3 = dict()

2. 访问

因为字典是无序的，所有只能通过 key 来访问 value：

>>> d2 = {'name': 'rose', 'age': 18}
>>> d2['name']			# 这种方法，当 key 不存在是会报 KeyError
'rose'

>>> d2.get('age')
18

3. 删除

del 语句可以用来删除一个元素，也可用于删除整个字典：

>>> d2 = {'name': 'rose', 'age': 18}
>>> del d2['name']		# 删除 name
>>> d2
{'age': 18}
>>> del d2		# 删除整个字典

4. 修改

通过 key 访问到 value，对其进行赋值，便可完成修改：

>>> d2 = {'name': 'rose', 'age': 18}
>>> d2['name'] = 'tom'
>>> d2
{'name': 'tom', 'age': 18}

3.2 内置方法

PART 1

# fromkeys（sequence[, value]）：内置的类方法 @staticmethod，接收一个序列，将序列中的元素作为键，value 默认为 None，返回一个新的字典
>>> d = dict.fromkeys(['a', 'b'], 2)
>>> d
{'a': 2, 'b': 2}

# get（key[, value]）：根据 key 获取 value，即使 key 不存在也不会报错，若 key 存在可以指定返回值
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2.get('age')
18
>>> d2.get('gender', '没找到')
'没找到'

# pop（key[,default]）：根据 key 删除一个元素，若 key 在字典中，将其删除并返回。否则返回默认值，如果 key 不存在，且又未指定默认值，引发 KeyError
>>> d2 = {'name': 'rose', 'age': 18}          
>>> s = d2.pop('name')   
>>> s
'rose'                                        
             
>>> d2.pop('gender', "don't find")            
"don't find"                                  
>>> d2.pop('gender')                  # key 不存在，且又未指定默认值，引发 KeyError        
Traceback (most recent call last):            
  File "<stdin>", line 1, in <module>         
KeyError: 'gender'                         
    
# popitem（）：从字典中随意删除一个元素，并返回
>>> d2 = {'name': 'rose', 'age': 18}
>>> s = d2.popitem()
>>> s
('age', 18)
>>> d2
{'name': 'rose'}

# setdefault（key[,default]）：设置字典键值对，若存在，不设置，并获取当前 key 对应的 value。若不存在，设置
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2.setdefault('gender', 'male')
'male'
>>> d2.setdefault('age', 19)
18
>>> d2
{'name': 'rose', 'age': 18, 'gender': 'male'}

# update（**kwargs）：更新字典
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2.update(age=20, gender='male')	# 若 key 存在，在更新，若不存在则新建键值对
>>> d2
{'name': 'rose', 'age': 20, 'gender': 'male'}

>>> d2.update({'a':20})		# 传入一个字典
>>> d2
{'name': 'rose', 'age': 18, 'a': 20}

PART 2

# keys（）：返回字典的 key
>>> d2 = {'name': 'rose', 'age': 18}
>>> k = d2.keys()
>>> k
dict_keys(['name', 'age'])
>>> for i in k:
...     print(i)
...
name
age

# values（）： 返回字典的 value
>>> v = d2.values()
>>> v
dict_values(['rose', 18])
>>> for i in v:
...     print(i)
...
rose
18

# items（）：返回字典的 key、value
>>> for k, v in d2.items():
...     print(k, v)
...
name rose
age 18

# clear（）：清空整个字典里的元组
>>> d2 = {'name': 'rose', 'age': 18}
>>> d2.clear()
>>> d2
{}

# copy（）：对字典进行浅拷贝
>>> d2 = {'name': 'rose', 'age': 18}
>>> d = d2.copy()
>>> d
{'name': 'rose', 'age': 18}

4. 集合

由不同元素组成的无序集合，里面的元素必须是不可变的，且每个元素都是唯一的。

无序，不能用索引方式访问
只能是数字、字符串、元组等不可变数据

4.1 基本操作

1. 创建

创建一个集合有两种方法：一是直接用大括号把一堆元素括起来；另一种是使用 set（）。

>>> s = {1, 2, 3}		# 不能使用大括号直接创建一个空集合，那样会创建一个字典
>>> s = set('123')
>>> s
{'3', '1', '2'}

>>> s = {1, 2, 3, 2}	# 创建一个重复的集合，会自动将重复的元素过滤
>>> s
{1, 2, 3}

2. 访问

因为集合中元素是无序的，所以不能通过索引访问，只能用 for 循环每个元素，或成员运算符判断元素是否在集合中。

>>> s = {'3', '1', '2'}
>>> for i in s:
...     print(i)
...
3
1
2
>>> '3' in s
True

3. 转换类型

不能将数字和字典转换为集合。

>>> set([1,2,3])		
{1, 2, 3}
>>> set('123')
{'3', '1', '2'}

4.2 内置方法

# add（*args， **kwargs）：添加一个元素
>>> s = {1, 2, 3}
>>> s.add(4)
>>> s
{1, 2, 3, 4}

# clear（）：清空集合
>>> s = {1, 2, 3}
>>> s.clear()
>>> s
set()

# copy（）：浅拷贝
>>> s = {1, 2, 3}
>>> s1 = s.copy()
>>> s1
{1, 2, 3, 4}

# pop（）：随机移除一个元素
>>> s1 = {1, 2, 3}
>>> s1.pop()
1
>>> s1
{2, 3}

# remove（value）：删除某个指定元素，若元素不存在抛出 KeyError
>>> s1 = {1, 2, 3}
>>> s1.remove(2)
>>> s1
{1, 3}

# discard（value）：与 remove（）一样都是删除某个元素，但是元素不存在不会报错
>>> s1 = {1, 2, 3}
>>> s1.discard(4)

# difference_update（set2）：更新集合，相当于 s1 = s1 - s2
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.difference_update(s2)
>>> s1
{1}

# intersection_update（set2）：求交集，与 intersection（）不同的是它不会改变原集合，而 intersection（）返回新的集合
>>> s1 = {1, 2, 3}                   
>>> s2 = {2, 3, 4}                   
>>> s1.intersection(s2)              
{2, 3}                               
>>> s1                               
{1, 2, 3}                            

# set1.isdisjoint（set2）：判断两个集合有无交集，有交集返回 False
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.isdisjoint(s2)
False

# s1.issubset（set2）：判断 set1 是否是 set2 的子集（即 set1 <= set2)
# set1.issuperset（set2）：判断 set1 是否是 set2 的父集
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.issubset(s2)
False
>>> s1.issuperset(s2)
False

# set.update（set2）：给集合添加元素，参数可以是集合、字符串、列表、元组、字典等
>>> s1 = {1, 2, 3}                               
>>> s1.update({'a':'b'})           # 字典              
>>> s1                                           
{1, 2, 3, 'a'}                                                    
>>> s1.update([4, 5])                  # 列表          
>>> s1.update({6, 7})                        # 集合    
>>> s1                                           
{1, 2, 3, 4, 5, 6, 7, 'a'}                       

# set1.symmetric_difference_update（set2）：求交叉补集，在原集合上更新，将不重复的元素添加到原集合中
>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.symmetric_difference_update(s2)
>>> s1
{1, 4}

不可变集合

有时想要像元组一样不能随意添加、删除集合元素，可以使用 frozenset（）函数定义一个不可变集合。

>>> s1 = frozenset({1, 2, 3})
>>> s1.add(4)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'frozenset' object has no attribute 'add'

4.3 集合关系运算

1. 交集（&）

交集即两个集合重复的部分，intersection（）方法可以用来求两个集合的交集，并返回交集，不改变原集合。

set1.intersection（set2）
set1 & set2

>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.intersection(s2)
{2, 3}
>>> s1
{1, 2, 3}
>>> s1 & s2
{2, 3}

2. 并集（|）

并集即将两个集合的所有元素并在一起，重复的只出现一次，可以用作简单去重。

set1.union(set2)
set1 | set2

>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.union(s2)
{1, 2, 3, 4}
>>> s1 | s2
{1, 2, 3, 4}

3. 差集（-）

差集即 set1 - set2，两个集合中重复的元素去掉，仅包含第一个集合中剩余的元素，不包含第二个集合剩余的元素，不改变原集合。

set1.difference(set2）
set1 - set2

>>> s1 = {1, 2, 3}
>>> s2 = {2, 3, 4}
>>> s1.difference(s2)
{1}
>>> s1 - s2
{1}
>>> s1
{1, 2, 3}

4. 交叉补集（^）

交叉补集即两个集合不重复的元素，不改变原集合。

set1.symmetric_difference(set2)
set1 ^ set2

>>> s1 = {1, 2, 3}                                             
>>> s2 = {2, 3, 4}                                             
>>> s1.symmetric_difference(s2)                                
{1, 4}                                                         
>>> s1                                                         
{1, 2, 3}                                                      
>>> s1 ^ s2                                                    
{1, 4}

5. 去重

可以利用集合对列表进行简单去重，先将其转换为集合，再转换为列表，需要注意的是，元素顺序将会改变。

>>> names = ['rose', 'lila', 'tom', 'rose']
>>> names = list(set(names))
>>> names
['lila', 'tom', 'rose']

5. 序列

序列即有序元素集合，是可迭代对象，包括字符串、列表、元组，它们之间用很多共同点：

都可以通过索引获取值，即是有序（索引从 0 开始）
可以切片
有共同的操作符（重复、拼接、成员关系操作符等）

enumerate（）方法

enumerate（iterable）方法用于生成一个二元组（二元组即元素数量为二的元组）构成的一个可迭代对象，每个二元组由可迭代索引与对应元素组成。

>>> s = 'abc'
>>> for i in enumerate(s):
...     print(i)
...
(0, 'a')
(1, 'b')
(2, 'c')

6. 练习

字典无限嵌套

cities={
    '北京':{
        '朝阳':['国贸','CBD','天阶','我爱我家','链接地产'],
        '海淀':['圆明园','苏州街','中关村','北京大学'],
        '昌平':['沙河','南口','小汤山',],
        '怀柔':['桃花','梅花','大山'],
        '密云':['密云A','密云B','密云C']
    },
    '河北':{
        '石家庄':['石家庄A','石家庄B','石家庄C','石家庄D','石家庄E'],
        '张家口':['张家口A','张家口B','张家口C'],
        '承德':['承德A','承德B','承德C','承德D']
    }
}
for i in cities['北京']:
    print(i)
朝阳
海淀
昌平
怀柔
密云

for i in cities['北京']['海淀']:
    print(i)
圆明园
苏州街
中关村
北京大学