第九篇：Python推导式：简洁高效的数据处理利器-CSDN博客

本文链接：https://blog.csdn.net/m0_74252611/article/details/140445397

推导式（Comprehensions）是Python中一种简洁而强大的语法，用于从已有的可迭代对象（如列表、元组、字典、集合）创建新的可迭代对象。推导式不仅提高了代码的可读性，还能显著提升性能。本文将详细介绍Python中的四种推导式：列表推导式、元组推导式、字典推导式和集合推导式。

一. 列表推导式

结果是列表。

格式

[表达式 for 元素 in 可迭代对象 if 条件]

示例

# 生成平方数列表
squares = [x**2 for x in range(10)]
print(squares)  # 输出: [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

# 生成偶数的平方列表
even_squares = [x**2 for x in range(10) if x % 2 == 0]
print(even_squares)  # 输出: [0, 4, 16, 36, 64]

# 将华氏温度转换为摄氏温度
fahrenheit = [32, 68, 86, 104, 122]
celsius = [(f - 32) * 5/9 for f in fahrenheit]
print(celsius)  # 输出: [0.0, 20.0, 30.0, 40.0, 50.0]

二. 元组推导式（生成器表达式）

结果是生成器（Generator）

格式

(表达式 for 元素 in 可迭代对象 if 条件)

示例

# 创建平方数生成器
squares_generator = (x**2 for x in range(10))
print(squares_generator)  # 输出: <generator object <genexpr> at 0x...>

# 使用生成器
for square in squares_generator:
    print(square, end=' ')
# 输出: 0 1 4 9 16 25 36 49 64 81

# 生成器用于大数据集时更节省内存
large_gen = (x for x in range(1000000) if x % 3 == 0)
print(sum(large_gen))  # 计算所有3的倍数的和，不会占用大量内存

三. 字典推导式

结果是字典

格式

{键表达式: 值表达式 for 元素 in 可迭代对象 if 条件}

示例

# 创建数字及其平方的字典
squares_dict = {x: x**2 for x in range(5)}
print(squares_dict)  # 输出: {0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

# 创建偶数及其平方的字典
even_squares_dict = {x: x**2 for x in range(10) if x % 2 == 0}
print(even_squares_dict)  # 输出: {0: 0, 2: 4, 4: 16, 6: 36, 8: 64}

# 将字符串中的字符映射到其ASCII值
string = "hello"
char_to_ascii = {char: ord(char) for char in string}

print(char_to_ascii)  # 输出: {'h': 104, 'e': 101, 'l': 108, 'o': 111}

四. 集合推导式

结果是集合格式

{元素表达式 for 元素 in 可迭代对象 if 条件}

示例

# 创建平方数集合

squares_set = {x**2 for x in range(10)}
print(squares_set)  # 输出: {0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

# 创建偶数平方的集合
even_squares_set = {x**2 for x in range(10) if x % 2 == 0}
print(even_squares_set)  # 输出: {0, 4, 16, 36, 64}

# 从字符串中提取唯一字符
text = "hello world"
unique_chars = {char for char in text if char.isalpha()}
print(unique_chars)  # 输出: {'d', 'e', 'h', 'l', 'o', 'r', 'w'}

推导式的通用格式

第一部分：表达式
用于生成新可迭代对象的元素。

第二部分：循环
遍历已有的可迭代对象。

第三部分：条件(可选)
用于筛选元素。

示例与应用

1. 列表推导式应用

# 筛选出长度大于3的单词
words = ["apple", "banana", "cherry", "date"]
long_words = [word for word in words if len(word) > 3]
print(long_words)  # 输出: ["apple", "banana", "cherry"]

# 创建一个包含元组的列表
coordinates = [(x, y) for x in range(3) for y in range(2)]
print(coordinates)  # 输出: [(0, 0), (0, 1), (1, 0), (1, 1), (2, 0), (2, 1)]

2. 字典推导式应用

# 反转字典的键值对
original_dict = {"a": 1, "b": 2, "c": 3}
reversed_dict = {value: key for key, value in original_dict.items()}
print(reversed_dict)  # 输出: {1: "a", 2: "b", 3: "c"}

# 创建字母及其在字母表中位置的字典
alphabet = {chr(65+i): i+1 for i in range(26)}
print(alphabet)  # 输出: {'A': 1, 'B': 2, ..., 'Z': 26}

3. 集合推导式应用

# 去除列表中的重复元素
numbers = [1, 2, 2, 3, 3, 3, 4, 5, 5]
unique_numbers = {num for num in numbers}
print(unique_numbers)  # 输出: {1, 2, 3, 4, 5}

总结

Python的推导式提供了一种简洁而高效的方式来创建新的可迭代对象。通过合理使用列表推导式、元组推导式（生成器表达式）、字典推导式和集合推导式，可以显著提高代码的可读性和性能。以下是一些关键点和最佳实践：

1. 性能考虑：

推导式通常比等效的循环快，特别是在处理大量数据时。
对于非常大的数据集，考虑使用生成器表达式以节省内存。

2. 可读性：

保持推导式简单明了。如果表达式变得过于复杂，考虑拆分或使用常规循环。
对于多重循环或复杂条件，可能传统的for循环更易读和维护。

3. 适用场景：

数据转换：快速将一种数据结构转换为另一种。
过滤：根据条件筛选元素。
组合：将多个可迭代对象组合成新的数据结构。

4. 注意事项：

避免在推导式中执行有副作用的操作。
对于需要多次使用的结果，先将推导式的结果存储在变量中。

结论：Python推导式是一个强大的语言特性，能够使代码更加简洁、易读，并且在许多情况下提供更好的性能。通过掌握和合理使用推导式，Python开发者可以编写出更加优雅和高效的代码。然而，也要注意不要过度使用，保持代码的可读性和可维护性始终是最重要的。