字典是Python语言中唯一的映射类型。简单的来讲,字典是一个可变的容器,能存储任意个数的键值对,其中键必须是不可变类型,通常用字符串作为键,值则可以是任意类型。
字典中的每一个键只能对应一个值,同一个键重复赋值只会保留最后一次赋值结果。
字典中的键必须是可哈希的,即必须为不可变类型,通常用字符串类型作为字典的键,也可以使用数字、元组,但不推荐。
1、创建字典
字典类型是由任意个键值对构成,每个键值对用冒号(:)分割,所有键值对用大括号{}包围。
创建字典可以直接将字典赋值给变量,也可以通过工厂函数dict()进行创建。
# 创建字典
dic1 = {"host": "127.0.0.1", "port": 80}
dic2 = dict(host="localhost", port=443)
print(dic1, dic2)
# {'host': '127.0.0.1', 'port': 80} {'host': 'localhost', 'port': 443}
2、访问字典
与之前文章中提到的序列类型不同,字典类型中的值是无序的,只能通过对应的键进行访问。
如果我们想查看字典中所有的值,字典为我们提供了items()、keys()、values()方法,我们可以根据实际需要进行遍历查看。
# 访问字典
dic1 = {"host": "127.0.0.1", "port": 80}
host = dic1['host']
port = dic1['port']
print(host, port)
# 127.0.0.1 80
for item in dic1.items():
print(item)
# ('host', '127.0.0.1')
# ('port', 80)
for key in dic1.keys():
print(dic1[key])
# 127.0.0.1
# 80
for value in dic1.values():
print(value)
# 127.0.0.1
# 80
3、修改字典
字典是可变类型,字典中的键值对可以任意添加修改或删除。值得注意的是,字典中的键值对是一对一的关系,当对一个键赋值两次的时候,只会保留最后一次的值,之前的值会被替换掉。
# 修改字典
dic1 = {"host": "127.0.0.1", "port": 80}
dic1['name'] = "service"
print(dic1)
# {'host': '127.0.0.1', 'port': 80, 'name': 'service'}
dic1['host'] = "192.168.1.1"
print(dic1)
# {'host': '192.168.1.1', 'port': 80, 'name': 'service'}
4、删除字典或字典元素
dic2 = dict(host="localhost", port=443)
# 删除键为“host”的条目
del dic2['host']
print(dic2)
# {'port': 443}
# 删除 dic2 中所有的条目
dic2.clear()
print(dic2)
# {}
# 删除整个 dic2 字典
del dic2
print(dic2)
# NameError: name 'dic2' is not defined
5、字典高级功能
5.1 字典合并
当我们需要的值存在于不同的字典当中时,逐个字典查询显然不是最优解,如果能够将多个字典合并为一个,那查询起来岂不是可以方便很多。
实际上,Python已经帮我们实现了此类功能,同时我们也可以根据自己的需要,定制自己专属的合并方法。
# 方法1 update方法:用dic2更新dic1,若遇重复键,则更新为dic2中的值
# 此方法并不会返回新的对象,只是修改了dic1中的值
dic1 = {"a": 1, "b": 2, "c": 3}
dic2 = {"c": 2, "d": 3, "e": 4}
dic1.update(dic2)
print("dic1:", dic1)
print("dic2:", dic2)
# 输出
# dic1: {'a': 1, 'b': 2, 'c': 2, 'd': 3, 'e': 4}
# dic2: {'c': 2, 'd': 3, 'e': 4}
# 方法2 dic()工厂函数:用dic2更新dic1,若遇重复键,则更新为dic2中的值
# 此方法会生成一个新的字典,原有的字典值不变
dic1 = {"a": 1, "b": 2, "c": 3}
dic2 = {"c": 2, "d": 3, "e": 4}
dic3 = dict(dic1, **dic2)
print("dic1:", dic1)
print("dic2:", dic2)
print("dic3:", dic3)
# 输出
# dic1: {'a': 1, 'b': 2, 'c': 3}
# dic2: {'c': 2, 'd': 3, 'e': 4}
# dic3: {'a': 1, 'b': 2, 'c': 2, 'd': 3, 'e': 4}
# 方法3:自定义 通过for循环遍历其中一个字典,将键值对更新至另一个字典中
# 由于是自定义方法,所以我们可以根据需要,对重复的键做各种处理
dic1 = {"a": 1, "b": 2, "c": 3}
dic2 = {"c": 2, "d": 3, "e": 4}
for k, v in dic2.items():
if k in dic1.keys():
# 若键存在,则更新
# dic1[k] = v
# continue
# 若键存在,则跳过
# continue
# 若键存在,则值相加
dic1[k] += v
else:
dic1[k] = v
print(dic1)
print(dic2)
# 输出
# {'a': 1, 'b': 2, 'c': 5, 'd': 3, 'e': 4}
# {'c': 2, 'd': 3, 'e': 4}
5.2 利用字典进行统计
当我们需要对一个数据集合中的元素进行统计时,可以借助字典的特性,快速的实现统计。
事实上,很多算法场景中,都会运用到字典的键可哈希的特性进行统计。同时也因此,此方法只适用于统计可哈希对象,不可哈希的对象则需要另外设计新的方法处理。
# 统计列表中各字符串出现的次数
lst = ["aaa", "bbb", "ccc", "ddd", "ccc", "ddd", "aaa", "aaa", "eee", "ddd", "ccc"]
result = dict()
for ch in lst:
if ch not in result.keys():
result[ch] = 1
else:
result[ch] += 1
print(result)
# 输出
# {'aaa': 3, 'bbb': 1, 'ccc': 3, 'ddd': 3, 'eee': 1}