第六章 字典
6.1 一个简单的字典
来看一个包含外星人的游戏,这些外星人的颜色和分数各不相同。下面是一个简单的字典,存储了有关特定外星人的信息:
alien_0 = {'color':'green','points':5}
print(alien_0['color'])
print(alien_0['points'])
字典alien_0存储了外星人的颜色和分数。最后两行代码访问并显示这些信息:
green
5
6.2 使用字典
在python中,字典是一系列键值对。每个键都与一个值相关联,你可以使用键来访问相关的值。与键相关联的值可以是数、字符串、列表乃至字典。事实上,可将任何python对象用作字典中的值。
在python中,字典用放在花括号{ }中的一系列键值对表示,如前面的示例所示:
alien_0 = {'color':'green','points':5}
键值对是两个相关联的值。指定键时,python将返回与之相关联的值。键和值之间用冒号分隔,而键值对之间用逗号分隔。在字典中,想存储多少个键值对都可以。
最简单的字典只有一个键值对,如下述修改后的字典alien_0所示:
alien_0 = {'color':'green'}
这个字典存储了一项有关alien的信息,具体地说是这个外星人的颜色。在该字典中,字符串’color’是一个键,与之相关联的值为’green’。
6.2.1 访问字典中的值
要获取与键相关联的值,可依次指定字典名和放在方括号内的键,如下所示:
alien_0 = {'color':'green'}
print(alien_0['color'])
这将返回字典alien_0中与键’color’相关联的值:
green
字典中可包含任意数量的键值对。例如,下面是最初的字典alien_0,其中包含两个键值对:
alien_0 = {'color':'green','points':5}
现在你可以访问外星人alien_0的颜色和分数。如果玩家射杀了这个外星人,就可以使用下面的代码来确定应获得多少分:
alien_0 = {'color':'green','points':5}
new_points = alien_0['points']
print(f"You just earned {new_points} points!")
输出:
You just earned 5 points!
6.2.2 添加键值对
字典是一种动态结构,可随时在其中添加键值对。要添加键值对,可依次指定字典名、用方括号括起来的键和相关联的值。
下面在字典alien_0中添加两项信息:外星人的x坐标和y坐标,让我们能够在屏幕的特定位置显示该外星人。我们将这个外星人放在屏幕左边缘,且离屏幕顶部25像素的地方。由于屏幕坐标系的原点通常在左上角,要将该外星人放在屏幕左边缘,可将x坐标设置为0;要将该外星人放在离屏幕顶部25像素的地方,可将y坐标设置为25,如下:
alien_0 = {'color':'green','points':5}
print(alien_0)
alien_0['x_position'] = 0
alien_0['y_position'] = 25
print(alien_0)
输出:
{'color': 'green', 'points': 5}
{'color': 'green', 'points': 5, 'x_position': 0, 'y_position': 25}
这个字典的最终版本包含四个键值对。
6.2.3 先创建一个空字典
在空字典中添加键值对有时候可提供便利,而有时必须这样做。为此可先使用一对空花括号定义一个字典,再分行添加各个键值对。如下:
alien_0 = {}
alien_0['color'] = 'green'
alien_0['points'] = 5
print(alien_0)
输出:
{'color': 'green', 'points': 5}
使用字典来存储用户提供的数据或在编写能自动生成大量键值对的代码时,通常需要先定义一个空字典。
6.2.4 修改字典中的值
要修改字典中的值,可依次指定字典名、用方括号括起来的键,以及与该键相关联的新值。例如,随着游戏进行,需要将一个外星人从绿色改成黄色:
alien_0 = {'color':'green'}
print(alien_0)
alien_0['color'] = 'yellow'
print(alien_0)
输出:
{'color': 'green'}
{'color': 'yellow'}
来看一个更有趣的例子,对一个能够以不同速度移动的外星人进行位置跟踪。为此,我们将存储该外星人的当前速度,并根据此确定该外星人将向右移动多远:
alien_0 = {'x_position':0,'y_position':25,'speed':'medium'}
print(f"Original x-position:{alien_0['x_position']}")
#向右移动外星人
#根据当前速度确定外星人向右移动多远
if alien_0['speed'] == 'slow':
x_increment = 1
elif alien_0['speed'] == 'medium':
x_increment = 2
else:
#这个外星人的移动速度肯定更快
x_increment = 3
#新位置为旧位置加上移动距离
alien_0['x_position'] += x_increment
print(f"New x-position: {alien_0['x_position']}")
输出:
Original x-position:0
New x-position: 2
6.2.5 删除键值对
对于字典中不需要的信息,可使用del语句将相应的键值对彻底删除。使用得了语句时,必须指定字典名和需要删除的键。
例如,下面的代码从字典alien_0中删除键‘points’和其值:
alien_0 = {'color':'green','points':5}
print(alien_0)
del alien_0['points']
print(alien_0)
输出:
{'color': 'green', 'points': 5}
{'color': 'green'}
注意: 删除的键值会永远消失
6.2.6 由类似对象组成的字典
在前面的示例中,字典存储的是一个对象的多种信息,但你也可以使用字典来存储众多对象的同一种信息。例如,假设你要调查很多人,询问他们最喜欢的编程语言,可使用一个字典来存储这种简单调查的结果,如下:
favorite_languages = {
'jen':'python',
'sarah':'c',
'edward':'ruby',
'phil':'python',
}
我们将一个较大的字典放在了多行中。每个键都是一个被调查者的名字,而每个值都是被调查者喜欢的语言。确定需要使用多行来定义字典,要在输入左花括号后按回车键。在下一行缩进四个空格,指定第一个键值对,并在它后面加一个逗号。此后再按回车键时,编辑器会自动缩进后续键值对,且缩进量与第一个键值相同。
定义好字典后,在最后一个键值对的下一行添加一个右花括号,并缩进四个空格,使其与字典中的键对齐。一种不错的做法是,在最后一个键值后面也加上逗号,为以后在下一行添加键值对做好准备。
注意:对于较长的列表和字典,大多数编辑器提供了以类似方式设置格式的功能。对于较长的字典,还有其它一些可行的格式设置方式,因此在你的编辑器或其它源代码中,你可能会看到稍微不同的格式设置方式。
给定被调查者的名字,可使用这个字典轻松获悉他喜欢的语言:
favorite_languages = {
'jen':'python',
'sarah':'c',
'edward':'ruby',
'phil':'python',
}
language = favorite_languages['sarah'].title()
print(f"Sarah's favorite language is {language}.")
输出:
Sarah's favorite language is C.
6.2.7 使用get( )来访问值
使用放在方括号内的键从字典中获取感兴趣的值时,可能会引发问题:如果指定的键不存在就会出错。
如果你要求获取外星人的分数,而这个外星人没有分数,结果如何?
alien_0 = {'color':'green','speed':'slow'}
print(alien_0['points'])
这将导致python显示traceback,指出存在键值错误(KeyError):
Traceback (most recent call last):
File "D:\major\机器学习\作业4\untitled0.py", line 2, in <module>
print(alien_0['points'])
KeyError: 'points'
第10章将详细介绍如何处理类似的错误,但就字典而言,可使用方法get( )在指定的键不存在时返回一个默认值,从而避免这样的错误。
方法get( )的第一个参数用于指定键,是必不可少的;第二个参数为指定的键不存在时要返回的值,是可选的:
alien_0 = {'color':'green','speed':'slow'}
point_value = alien_0.get('points','No point value assigned.')
print(point_value)
如果字典中有键‘points’,将获得与之相关联的值;如果没有,将获得指定的默认值。虽然这里没有键’points’,但将获得一条清晰的消息,不会引发错误:
No point value assigned.
如果指定的键有可能不存在,应考虑使用方法get( ),而不要使用方括号表示法。
注意:调用get( )时,如果没有指定第二个参数且指定的键不存在,python将返回值None。这个特殊值表示没有对应的值。None并非错误,而是一个表示所需值不存在的特殊值,第8章将详细介绍它的其它用途。
6.3 遍历字典
一个python字典可能包含几个键值对,也可能包含数百万个键值对。鉴于字典可能包含大量数据,python支持对字典进行遍历。字典可用于以各种方式存储信息,因此有多种遍历方式:可遍历字典的所有键值对,也可仅遍历键或值。
6.3.1 遍历所有键值对
探索各种遍历方法前,先来看一个新字典,它用于存储有关网站用户的信息。下面的字典存储一名用户的用户名,名和姓:
user_0 = {
'username':'efermi',
'first':'enrico',
'last':'fermi',
}
利用本章前面介绍的知识,可访问user_0的任何一项信息,但如果要获悉该用户字典中的所有信息,该怎么办呢?可使用for循环来遍历这个字典:
user_0 = {
'username':'efermi',
'first':'enrico',
'last':'fermi',
}
for key,value in user_0.items():
print(f"\nKey:{key}")
print(f"Value:{value}")
要编写遍历字典的for循环,可声明两个变量,用于存储键值对中的键和值。这两个变量可以使用任意名称。下面的代码使用了简单的变量名,这完全可行:
for key,value in user_0.items()
for语句的第二部分包含字典名和方法items( ),它返回一个键值对列表。接下来,for循环依次将每个键值对赋给指定的两个变量。在本例中,使用这两个变量来打印每个键及其相关联的值。第一个函数调用print( )中的"\n"确保在输出每个键值对前插入一个空行:
Key:username
Value:efermi
Key:first
Value:enrico
Key:last
Value:fermi
在6.2.6节的示例favorite_languages中,字典存储的是不同人的同一种信息。对于类似这样的字典,遍历所有的键值对很合适。如果遍历字典favorite_languages,将得到其中每个人的姓名和喜欢的编程语言。由于该字典中的键都是人名,值都是语言,因此在循环中使用变量name和language,而不是key和value。这让人更容易明白循环的作用:
favorite_languages = {
'jen':'python',
'sarah':'c',
'edward':'ruby',
'phil':'python',
}
for name,language in favorite_languages.items():
print(f"{name.title()}'s favorite language is {language.title()}.")
输出:
Jen's favorite language is Python.
Sarah's favorite language is C.
Edward's favorite language is Ruby.
Phil's favorite language is Python.
6.3.2 遍历字典中的所有键
在不需要使用字典中的值时,方法key( )很有用。下面来遍历字典favorite_languages,并将每个被调查者的名字打印出来:
favorite_languages = {
'jen':'python',
'sarah':'c',
'edward':'ruby',
'phil':'python',
}
for name in favorite_languages.keys():
print(name.title())
输出:
Jen
Sarah
Edward
Phil
遍历字典时,会默认遍历所有的键。因此,如果将上述代码中的:
for name in favorite_languages.keys():
替换为:
for name in favorite_languages:
输出将不变。
显式地使用方法key( )可以让代码更容易理解,你可以选择这样做,也可以省略它。
在这种循环中,可使用当前键来访问与之相关联的值。下面打印两条消息,指出两位朋友喜欢的语言。像前面一样遍历字典中的名字,但在名字为指定朋友的名字时,打印一条消息,指出其喜欢的语言:
favorite_languages = {
'jen':'python',
'sarah':'c',
'edward':'ruby',
'phil':'python',
}
friends = ['phil','sarah']
for name in favorite_languages.keys():
print(f"Hi {name.title()}.")
if name in friends:
language = favorite_languages[name].title()
print(f"\t{name.title()},I see you love {language}!")
每个人的名字都会被打印,但只对朋友打印特殊消息:
Hi Jen.
Hi Sarah.
Sarah,I see you love C!
Hi Edward.
Hi Phil.
Phil,I see you love Python!
还可使用方法key( )确定某个人是否接受了调查。下面的代码确定Erin是否接受了调查:
favorite_languages = {
'jen':'python',
'sarah':'c',
'edward':'ruby',
'phil':'python',
}
if 'erin' not in favorite_languages.keys():
print("Erin,please take our poll!")
输出:
Erin,please take our poll!
方法keys( )并非只能用于遍历:实际上,它返回一个列表,其中包含字典中的所有键。因此,上述代码只是核实’erin’是否在这个列表中。
6.3.3 按特定顺序遍历字典中的所有键
从python3.7起,遍历字典时将按插入的顺序返回其中的元素。不过在有些情况下,你可能要按与此不同的顺序遍历字典。
要以特定的顺序返回元素,一种办法是在for循环中对返回的键进行排序。为此,可使用函数sorted( )来获得按特定顺序排列的键列表的副本:
favorite_languages = {
'jen':'python',
'sarah':'c',
'edward':'ruby',
'phil':'python',
}
for name in sorted(favorite_languages.keys()):
print(f"{name.title()},thank you for taking the poll!")
这条for语句类似于其它for语句,不同之处是对方法dictionary.keys( )的结果调用了函数sorted( )。这让python列出字典中的所有键,并在遍历前对这个列表进行排序。输出表明,按顺序显示了所有被调查者的名字:
Edward,thank you for taking the poll!
Jen,thank you for taking the poll!
Phil,thank you for taking the poll!
Sarah,thank you for taking the poll!
6.3.4 遍历字典中的所有值
如果主要对字典包含的值感兴趣,可使用方法values( )来返回一个值列表,不包含任何键。例如,假设我们想获得一个列表,其中只包含被调查者选择的各种语言,而不包含被调查者的名字,可以这样做:
favorite_languages = {
'jen':'python',
'sarah':'c',
'edward':'ruby',
'phil':'python',
}
print("The following languages have been mentioned:")
for language in favorite_languages.values():
print(language.title())
这条for语句提取字典中的每个值,并将其依次赋给变量language。通过打印这些值,就获得了一个包含被调查者所选择语言的列表:
The following languages have been mentioned:
Python
C
Ruby
Python
这种做法提取字典中所有的值,而没有考虑是否重复。涉及的值很少时,这也许不是问题,但如果被调查者很多,最终的列表可能包含大量重复项。为剔除重复项,可使用集合(set)。集合中的每个元素都必须是独一无二的:
favorite_languages = {
'jen':'python',
'sarah':'c',
'edward':'ruby',
'phil':'python',
}
print("The following languages have been mentioned:")
for language in set(favorite_languages.values()):
print(language.title())
通过对包含元素的列表调用set( ),可让python找出列表中独一无二的元素,并使用这些元素来创建一个集合。上述代码使用set( )来提取favorite_languages.values( )中不同的语言。
结果是一个不重复的列表,其中列出了被调查者提及的所有语言:
The following languages have been mentioned:
C
Ruby
Python
注意:可使用一对花括号直接创建集合,并在其中用逗号分隔元素:
>>>languages = {'python','ruby','python','c'}
>>>languages
{'ruby','python','c'}
集合和字典很容易混淆,因为它们都是用一对花括号定义的。当花括号内没有键值对时,定义的很可能是集合。不同于列表和字典,集合不会以特定的顺序存储元素。
6.4 嵌套
有时候,需要将一系列字典存储在列表中,或将列表作为值存储在字典中,这称为嵌套。你可以在列表中嵌套字典、在字典中嵌套列表甚至在字典中嵌套字典。
6.4.1 字典列表
字典alien_0包含一个外星人的各种信息,但无法存储第二个外星人的信息,更别说屏幕上全部外星人的信息了。如何管理成群结队的外星人呢?一种办法是创建一个外星人列表,其中每个外星人都是一个字典,包含有关外星人的各种信息。例如,下面的代码创建一个包含三个外星人的列表:
alien_0 = {'color':'green','points':'5'}
alien_1 = {'color':'yellow','points':'10'}
alien_2 = {'color':'red','points':'15'}
aliens = [alien_0,alien_1,alien_2]
for alien in aliens:
print(alien)
首先创建三个字典,其中每个字典都表示一个外星人。然后将这些字典存储到一个名为aliens的列表中。最后,遍历这个列表,并将每个外星人都打印出来:
{'color': 'green', 'points': '5'}
{'color': 'yellow', 'points': '10'}
{'color': 'red', 'points': '15'}
更符合现实的情形是,外星人不止三个,且每个外星人都是使用代码自动生成的。在下面的示例中,使用range( )生成了30个外星人:
# 创建一个用于存储外星人的空列表
aliens = []
# 创建30个绿色的外星人
for alien_number in range(30):
new_alien = {'color': 'green', 'points': '5','speed':'slow'}
aliens.append(new_alien)
#显示前五个外星人
for alien in aliens[:5]:
print(alien)
print('...')
#显示创建了多少个外星人
print(f"Total number of aliens:{len(aliens)}")
输出:
{'color': 'green', 'points': '5', 'speed': 'slow'}
{'color': 'green', 'points': '5', 'speed': 'slow'}
{'color': 'green', 'points': '5', 'speed': 'slow'}
{'color': 'green', 'points': '5', 'speed': 'slow'}
{'color': 'green', 'points': '5', 'speed': 'slow'}
...
Total number of aliens:30
这些外星人都具有相同的特征,但在python看来,每个外星人都是独立的,这让我们能够独立地修改每个外星人。
在什么情况下需要成群结队的外星人呢?想象一下,可能随着游戏的进行,有些外星人会变色且加快速度。必要时,可使用for循环和if语句来修改某些外星人的颜色。例如,要将前三个外星人修改为黄色、速度为中等且值10分,可以这样:
# 创建一个用于存储外星人的空列表
aliens = []
# 创建30个绿色的外星人
for alien_number in range(30):
new_alien = {'color': 'green', 'points': '5','speed':'slow'}
aliens.append(new_alien)
for alien in aliens[:3]:
if alien['color'] == 'green':
alien['color'] = 'yellow'
alien['speed'] = 'medium'
alien['points'] = 10
#显示前五个外星人
for alien in aliens[:5]:
print(alien)
print('...')
鉴于要修改前三个外星人,我们遍历一个只包含这些外星人的切片。当前,所有外星人都是绿色的,但情况并非总是如此,因此编写一条if的语句来确保只修改绿色外星人。如果外星人是绿色的,就修改其颜色,速度和分值,输出如下:
{'color': 'yellow', 'points': 10, 'speed': 'medium'}
{'color': 'yellow', 'points': 10, 'speed': 'medium'}
{'color': 'yellow', 'points': 10, 'speed': 'medium'}
{'color': 'green', 'points': '5', 'speed': 'slow'}
{'color': 'green', 'points': '5', 'speed': 'slow'}
...
可进一步扩展这个循环,在其中添加一个elif代码块,将黄色外星人改为移动速度快且值15分的红色外星人,如下(这里只列出了循环,没有列出整个程序):
for alien in aliens[:3]:
if alien['color'] == 'green':
alien['color'] = 'yellow'
alien['speed'] = 'medium'
alien['points'] = 10
elif alien['color'] == 'yellow':
alien['color'] = 'red'
alien['speed'] = 'fast'
alien['points'] = 15
经常需要在列表中包含大量的字典,而其中每个字典都包含特定对象的众多信息。例如,你可能需要为网站的每个用户创建一个字典(就像6.3.1节的user中那样),并将这些字典存储在一个名为user的列表中。在这个列表中,所有字典的结构都相同,因此你可以遍历这个列表,并以相同的方式处理其中的每个字典。
6.4.2 在字典中存储列表
有时候需要将列表存储在字典中,而不是将字典存储在列表中。例如,你如何描述顾客点的比萨呢?如果使用列表,只能存储要添加的比萨配料;但如果用字典,就不仅可以在其中包含配料列表,还可包含其它有关比萨的描述。
在下面的示例中,存储了比萨的两方面信息:外皮类型和配料列表。配料列表是一个与键’toppings’相关联的值。要访问该列表,我们使用字典名和键’toppings’,就像访问字典中的其它值一样。这将返回一个配料列表,而不是单个值:
# 存储所点比萨的信息
pizza = {
'crust':'thick',
'toppings':['mushrooms','extra cheese'],
}
# 概述所点的比萨
print(f"You ordered a {pizza['crust']}-crust pizza "
"with the following toppings:")
for topping in pizza['toppings']:
print("\t"+topping)
首先创建一个字典,其中存储了有关顾客所点的比萨的信息。在这个字典中,一个键是’crust’,与之相关联的值是’thick’;下一个键是’toppings’,与之相关联的值是一个列表,其中存储了顾客要求添加的所有配料。如果调用函数print( )中的字符串很长,可以在合适的位置分行。只需在每行末尾都加上引号,同时对除第一行外的其它各行,都在行首加上引号并缩进。这样,python将自动合并圆括号内的所有字符串。为打印配料,编写一个for循环。为访问配料列表,使用键’toppings’。
输出:
You ordered a thick-crust pizzawith the following toppings:
mushrooms
extra cheese
每当需要在字典中将一个键关联到多个值时,都可以在字典中嵌套一个列表。在本章前面有关喜欢的编程语言的示例中,如果将每个人的回答存储在一个列表中,被调查者就可选择多种喜欢的语言。在这种情况下,当我们遍历字典时,与每个被调查者相关联的都是一个语言列表,而不是一种语言;因此,在遍历该字典的for循环中,我们需要再使用一个for循环来遍历与被调查者相关联的语言列表:
favorite_languages = {
'jen':['python','ruby'],
'sarah':['c'],
'edward':['ruby','go'],
'phil':['python','haskell'],
}
for name,languages in favorite_languages.items():
print(f"\n{name.title()}'s favorite languages are:")
for language in languages:
print(f"\t{language.title()}")
如你所见,现在与每个名字相关联的值都是一个列表。请注意,有些人喜欢的语言只有一种,而有些人有多种。遍历字典时,使用变量languages来依次存储字典中每个值的引用,因为我们知道这些值都是列表。在遍历字典的主循环中,使用了另一个for循环来遍历每个人喜欢的语言列表。现在,每个人想列出多少喜欢的语言都可以:
Jen's favorite languages are:
Python
Ruby
Sarah's favorite languages are:
C
Edward's favorite languages are:
Ruby
Go
Phil's favorite languages are:
Python
Haskell
为进一步改进这个程序,可在遍历字典的for循环开头添加一条if语句,通过查看len(languages)的值来确定当前的被调查者喜欢的语言是否是多种。如果他喜欢的语言有多种,就像以前一样显示输出;如果只有一种,就修改措辞。
favorite_languages = {
'jen':['python','ruby'],
'sarah':['c'],
'edward':['ruby','go'],
'phil':['python','haskell'],
}
for name,languages in favorite_languages.items():
if len(languages) == 1:
print(f"\n{name.title()}'s favorite languages is:")
for language in languages:
print(f"\t{language.title()}")
else:
print(f"\n{name.title()}'s favorite languages are:")
for language in languages:
print(f"\t{language.title()}")
注意:列表和字典的嵌套层级不应太多。如果嵌套层级比前面的示例多得多,很可能有更简单的解决方案。
6.4.3 在字典中存储字典
可在字典中嵌套字典,但这样做时,代码可能很快复杂起来。例如,如果有多个网站用户,每个用户都有独特的用户名,可在字典中将用户名作为键,然后将每位用户的信息存储在一个字典中,并将该字典作为与用户名相关联的值。在下面的程序中,存储了每位用户的三项信息:名,姓和居住地。为访问这些信息,我们遍历所有的用户名,并访问与每个用户名相关联的信息字典:
users = {
'aeinstein':{
'first':'albert',
'last':'einstein',
'location':'princeton',
},
'mcurie':{
'first':'marie',
'last':'curie',
'location':'paris',
},
}
for username,user_info in users.items():
print(f"\nUsername:{username}")
full_name = f"{user_info['first']}{user_info['last']}"
location = user_info['location']
print(f"\tFull name :{full_name.title()}")
print(f"\tLocation:{location.title()}")
首先定义一个名为users的字典,其中包含两个键:用户名’aeinstein’和’mcurie’。与每个键相关联的值都是一个字典,其中包含用户的名、姓和居住地。先遍历字典users,让python依次将每个键赋给遍历username,并依次将与当前键相关联的字典赋给变量user_info。在循环内部,将用户名打印出来。
随后开始访问内部的字典。变量user_info包含用户信息字典,而该字典包含三个键:‘first’,‘last’和’location’。对于每位用户,都使用这些键来生成整洁的姓名和居住地,然后打印有关用户的简要信息:
Username:aeinstein
Full name :Albert Einstein
Location:Princeton
Username:mcurie
Full name :Marie Curie
Location:Paris
请注意,表示每位用户的字典都具有相同的结构。虽然python并没有这样的要求,但这使得嵌套的字典处理起来更容易。倘若表示每位用户的字典都包含不同的键,for循环内部的代码将更复杂。