Python 列表推导式

什么是列表推导式

列表推导式（List Comprehension）是Python中一种简洁、优雅的创建列表的方式。它允许我们以简短的一行代码就能创建出复杂的列表，而不需要使用传统的循环和条件语句组合。列表推导式通常比等效的for循环更加高效和易读，是Python中函数式编程的重要特性之一。

提示

列表推导式是Python中特有的语法糖，能够大大提高代码的简洁性和可读性。

基本语法

列表推导式的基本语法如下：

[表达式 for 变量 in 可迭代对象]

这种语法相当于：

result = []
for 变量 in 可迭代对象:
    result.append(表达式)

让我们通过一个简单的例子来理解这个概念：

# 使用for循环创建平方数列表
squares = []
for x in range(10):
    squares.append(x**2)
print(squares)  # 输出: [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

# 使用列表推导式创建相同的平方数列表
squares = [x**2 for x in range(10)]
print(squares)  # 输出: [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

可以看到，列表推导式使代码更加简洁。

带条件的列表推导式

列表推导式还可以包含条件语句，进一步筛选元素：

[表达式 for 变量 in 可迭代对象 if 条件]

这种语法相当于：

result = []
for 变量 in 可迭代对象:
    if 条件:
        result.append(表达式)

例如，创建一个包含0到9之间偶数的平方的列表：

even_squares = [x**2 for x in range(10) if x % 2 == 0]
print(even_squares)  # 输出: [0, 4, 16, 36, 64]

嵌套的列表推导式

列表推导式还可以嵌套使用，处理多维数据：

# 创建一个3x3的矩阵
matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

# 使用嵌套列表推导式将矩阵转置
transposed = [[row[i] for row in matrix] for i in range(3)]
print(transposed)  # 输出: [[1, 4, 7], [2, 5, 8], [3, 6, 9]]

警告

嵌套的列表推导式可能会降低代码的可读性。如果你发现嵌套推导式难以理解，可以考虑使用普通的循环来提高代码的清晰度。

列表推导式VS传统循环

让我们比较一下列表推导式和传统循环的性能和可读性：

import time

# 使用传统循环
start = time.time()
result = []
for i in range(1000000):
    result.append(i**2)
end = time.time()
print(f"传统循环耗时: {end - start}秒")

# 使用列表推导式
start = time.time()
result = [i**2 for i in range(1000000)]
end = time.time()
print(f"列表推导式耗时: {end - start}秒")

# 输出示例：
# 传统循环耗时: 0.14469170570373535秒
# 列表推导式耗时: 0.09044623374938965秒

在大多数情况下，列表推导式不仅代码更简洁，而且执行速度也更快。

实际应用场景

数据清洗

# 过滤掉列表中的空字符串和None值
data = ["apple", None, "banana", "", "cherry", None]
clean_data = [item for item in data if item]
print(clean_data)  # 输出: ['apple', 'banana', 'cherry']

提取字典中的特定信息

# 从字典列表中提取特定键的值
users = [
    {"name": "Alice", "age": 25, "active": True},
    {"name": "Bob", "age": 30, "active": False},
    {"name": "Charlie", "age": 35, "active": True}
]

active_user_names = [user["name"] for user in users if user["active"]]
print(active_user_names)  # 输出: ['Alice', 'Charlie']

文件处理

# 读取文件并处理每一行
with open('example.txt', 'r') as file:
    lines = [line.strip().upper() for line in file if line.strip()]
    # 这将读取文件中的每一行，去除空白，转换为大写，并过滤掉空行

创建数值序列

# 生成斐波那契数列的前10个数
fib = [0, 1]
[fib.append(fib[-1] + fib[-2]) for _ in range(8)]
print(fib)  # 输出: [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

# 注意：这个例子中我们利用了列表推导式的副作用，但实际上它并不是列表推导式的最佳用法

列表推导式的限制与注意事项

尽管列表推导式功能强大，但也有一些限制和注意事项：

可读性：过于复杂的列表推导式会降低代码可读性。
内存使用：列表推导式会一次性生成整个列表，对于非常大的列表可能导致内存问题。在这种情况下，应考虑使用生成器表达式。
副作用：列表推导式主要用于创建新列表，而不应该用于产生副作用（如上面斐波那契例子中的做法并不推荐）。

与其他推导式的对比

Python提供了几种不同类型的推导式：

列表推导式：[x for x in iterable]
字典推导式：{key: value for item in iterable}
集合推导式：{x for x in iterable}
生成器表达式：(x for x in iterable)

各有其适用场景:

# 列表推导式
numbers = [1, 2, 2, 3, 4, 4, 5]
doubles = [x * 2 for x in numbers]
print(doubles)  # 输出: [2, 4, 4, 6, 8, 8, 10]

# 集合推导式（自动去重）
unique_doubles = {x * 2 for x in numbers}
print(unique_doubles)  # 输出: {2, 4, 6, 8, 10}

# 字典推导式
number_squares = {x: x**2 for x in range(6)}
print(number_squares)  # 输出: {0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25}

# 生成器表达式
gen_squares = (x**2 for x in range(6))
print(next(gen_squares))  # 输出: 0
print(next(gen_squares))  # 输出: 1

总结

列表推导式是Python中简洁、高效创建列表的强大工具。通过掌握列表推导式，你可以：

用一行代码替代传统的循环结构
提高代码的可读性和执行效率
更优雅地处理数据转换和过滤任务

当处理列表操作时，列表推导式通常是更加Pythonic的解决方案。然而，对于过于复杂的操作，仍应考虑使用常规循环以保持代码的可读性。

练习

使用列表推导式创建一个包含1到100中所有3的倍数的列表。
使用列表推导式将一个字符串列表转换为对应的长度列表。
使用嵌套列表推导式将一个二维列表展平为一维列表。
使用列表推导式从一个句子中提取所有4个字母以上的单词，并将它们转换为大写。

什么是列表推导式​

基本语法​

带条件的列表推导式​

嵌套的列表推导式​

列表推导式VS传统循环​

实际应用场景​

数据清洗​

提取字典中的特定信息​

文件处理​

创建数值序列​

列表推导式的限制与注意事项​

与其他推导式的对比​

总结​

练习​

延伸阅读​