Python字典全面解析：从菜鸟到高手-CSDN博客

本文链接：https://blog.csdn.net/x15514104477/article/details/148067825

Python字典全面解析：从菜鸟到高手

字典(Dictionary)是Python中最强大、最常用的数据类型之一，它就像现实生活中的字典一样，可以通过"关键词"快速找到对应的"解释"。本文将用最通俗易懂的方式，配合大量代码示例和可视化图表，带你彻底掌握Python字典。

一、字典是什么？

如果你学过 javascript 的话这里的字典类型就是相当于 javascript 中的 JSON 对象。

1. 生活化比喻

想象一个学生花名册：

姓名 → 学号
张三 → 2023001
李四 → 2023002
王五 → 2023003

这就是字典的典型应用——键值对(key-value)映射。

2. 基本概念

字典是：

无序的键值对集合（Python 3.7+开始保持插入顺序）
用大括号{}表示
每个元素是key: value的形式
键(key)必须是不可变类型（数字、字符串、元组等）
值(value)可以是任意类型

# 创建一个字典
student = {
    "name": "张三",
    "age": 18,
    "courses": ["数学", "英语"]
}

二、字典的创建方式

1. 直接创建

# 方法1：使用花括号
person = {"name": "李四", "age": 20}

# 方法2：使用dict()构造函数
person = dict(name="李四", age=20)

# 空字典
empty_dict = {}

2. 其他创建方式

# 从键值对列表创建
items = [("name", "王五"), ("age", 22)]
person = dict(items)

# 使用zip合并两个列表
keys = ["name", "age"]
values = ["赵六", 24]
person = dict(zip(keys, values))

# 字典推导式(类似列表推导式)
squares = {x: x*x for x in range(5)}
# 结果：{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

三、字典的基本操作

1. 访问元素

student = {"name": "张三", "age": 18}

# 方法1：使用键访问
print(student["name"])  # 输出: 张三

# 方法2：get()方法(更安全)
print(student.get("age"))      # 输出: 18
print(student.get("height"))   # 输出: None (不会报错)
print(student.get("height", "未知"))  # 输出: 未知 (设置默认值)

# 访问不存在的键会报错
# print(student["height"])  # KeyError

2. 添加/修改元素

student = {"name": "张三"}

# 添加/修改元素
student["age"] = 18          # 添加age键
student["name"] = "李四"     # 修改name键

# 使用update()批量更新
student.update({"age": 20, "gender": "男"})

3. 删除元素

student = {"name": "张三", "age": 18}

# 方法1：del语句
del student["age"]

# 方法2：pop()方法(可获取被删除的值)
age = student.pop("age")  # 同时返回18

# 方法3：popitem() (Python 3.7+删除最后插入的键值对)
last_item = student.popitem()

# 清空字典
student.clear()  # 变成 {}

# 删除整个字典
del student

四、字典的属性和方法

1. 常用方法大全

方法	描述	示例
`keys()`	返回所有键	`student.keys()` → `dict_keys(['name', 'age'])`
`values()`	返回所有值	`student.values()` → `dict_values(['张三', 18])`
`items()`	返回所有键值对	`student.items()` → `dict_items([('name', '张三'), ('age', 18)])`
`get(key, default)`	安全获取值	`student.get('age')` → `18`
`setdefault(key, default)`	键不存在时设置默认值	`student.setdefault('gender', '男')`
`update(other_dict)`	合并字典	`student.update({'age': 20})`
`pop(key)`	删除并返回键的值	`student.pop('age')` → `18`
`popitem()`	删除并返回最后插入的键值对	`student.popitem()` → `('age', 18)`
`clear()`	清空字典	`student.clear()`
`copy()`	浅拷贝字典	`new_student = student.copy()`

2. 重要属性

属性	描述	示例
`len()`	返回键值对数量	`len(student)` → `2`
`in` 操作	检查键是否存在	`'name' in student` → `True`

五、字典的进阶用法

1. 字典的遍历

student = {"name": "张三", "age": 18, "gender": "男"}

# 遍历所有键
for key in student:
    print(key)

# 等价于
for key in student.keys():
    print(key)

# 遍历所有值
for value in student.values():
    print(value)

# 遍历所有键值对
for key, value in student.items():
    print(f"{key}: {value}")

2. 字典的嵌套

# 嵌套字典
school = {
    "class1": {
        "student1": {"name": "张三", "age": 18},
        "student2": {"name": "李四", "age": 19}
    },
    "class2": {
        "student1": {"name": "王五", "age": 20}
    }
}

# 访问嵌套字典
print(school["class1"]["student1"]["name"])  # 输出: 张三

3. 字典的排序

# 按键排序
student = {"name": "张三", "age": 18, "gender": "男"}
sorted_by_key = dict(sorted(student.items()))
# 结果: {'age': 18, 'gender': '男', 'name': '张三'}

# 按值排序
sorted_by_value = dict(sorted(student.items(), key=lambda item: item[1]))

4. 默认字典(defaultdict)

from collections import defaultdict

# 默认值为0的字典
scores = defaultdict(int)
scores["张三"] += 1  # 自动初始化为0

# 默认值为列表的字典
classes = defaultdict(list)
classes["一班"].append("张三")

六、字典的性能特点

快速查找：无论字典有多大，查找速度几乎不变
- 因为基于哈希表实现，时间复杂度为O(1)
内存占用较大：比列表和元组占用更多内存
- 因为需要存储键和值以及哈希表结构
键必须是可哈希的：
- 可哈希 = 不可变（数字、字符串、元组等）
- 列表、字典等可变类型不能作为键

# 性能测试示例
import timeit

# 查找速度测试
dict_time = timeit.timeit('d["key"]', setup='d={"key": 1}', number=1000000)
list_time = timeit.timeit('l[0]', setup='l=[1]', number=1000000)
print(f"字典查找: {dict_time}")  # 约0.03秒
print(f"列表查找: {list_time}")  # 约0.04秒

七、常见误区与坑点

1. 键必须是不可变的

# 合法的键
good_keys = {
    123: "数字",
    "name": "字符串",
    (1,2): "元组"
}

# 非法的键
bad_dict = {
    [1,2]: "列表"  # TypeError: unhashable type: 'list'
}

2. 字典的"无序性"问题

# Python 3.6及之前版本，字典不保证顺序
# Python 3.7+ 开始保持插入顺序

# 不要依赖字典的顺序进行重要逻辑！

3. 浅拷贝问题

student = {"name": "张三", "scores": [80, 90]}
copy_student = student.copy()

copy_student["scores"].append(85)
print(student["scores"])  # [80, 90, 85] 原字典也被修改了！

# 深拷贝解决方案
import copy
deep_copy = copy.deepcopy(student)

八、实际应用案例

1. 统计词频

text = "apple banana apple orange banana apple"
words = text.split()

word_count = {}
for word in words:
    word_count[word] = word_count.get(word, 0) + 1

print(word_count)  # {'apple': 3, 'banana': 2, 'orange': 1}

2. 缓存数据

cache = {}

def get_data(key):
    if key not in cache:
        # 模拟耗时操作
        cache[key] = f"数据_{key}"
    return cache[key]

print(get_data(1))  # 第一次计算
print(get_data(1))  # 直接从缓存读取

3. 配置文件存储

config = {
    "database": {
        "host": "localhost",
        "port": 3306,
        "user": "admin"
    },
    "debug": True,
    "plugins": ["log", "monitor"]
}

# 访问配置
db_host = config["database"]["host"]

九、总结对比表

特性	字典(Dict)	列表(List)	元组(Tuple)
符号	`{}`	`[]`	`()`
元素	键值对	单元素	单元素
顺序	Python 3.7+保持插入顺序	有序	有序
可变性	可变	可变	不可变
查找速度	极快(O(1))	较慢(O(n))	较慢(O(n))
内存占用	较大	中等	较小
主要用途	键值映射	可变序列	不可变序列