最近在读写 MySQL 数据的过程中,碰到了需要处理 二维矩阵数据 行列转置 的问题,比如将:
[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]
# 注意:矩阵中每个子序列的长度是相同的
转化成:
[[1, 5, 9],
[2, 6, 10],
[3, 7, 11],
[4, 8, 12]]
# 行列转置之后的结果
在研究了一番之后,总结了以下这些方法,做个记录。
1. 最基础的 for 循环
def transpose_2d(data):
transposed = []
for i in range(len(data[0])):
new_row = []
for row in data:
new_row.append(row[i])
transposed.append(new_row)
return transposed
data = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]
print(transpose_2d(data))
# [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
# [Finished in 0.1s]
2. 使用列表推导式 List Comprehension
这个其实是第一种方法的高级简化写法。
def transpose_2d(data):
transposed = [[row[i] for row in data] for i in range(len(data[0]))]
return transposed
data = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]
print(transpose_2d(data))
# [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
# [Finished in 0.1s]
3. 使用 zip(*iterable) 函数(推荐)
一种高效的写法,因为 list, map, zip 都是 Python 内建的函数 (Built-ins),所以速度也是相当的快。
def transpose_2d(data):
# transposed = list(zip(*data))
# [(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)]
# 注意 zip 本身返回的数据类型为 tuple 元组
# 其中符号 * 号可以对元素进行解压或展开
transposed = list(map(list, zip(*data)))
return transposed
data = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]
print(transpose_2d(data))
# [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
# [Finished in 0.1s]
4. 使用 numpy 的 T 转置
from numpy import transpose
data = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]
transposed = transpose(data).tolist()
print(transposed)
# [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
# [Finished in 0.3s]
# 速度中规中矩,毕竟 numpy 用来处理数学更好
5. 使用 pandas 的 T 转置
from pandas import DataFrame
data = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]
transposed = DataFrame(data).T.values.tolist()
print(transposed)
# [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
# [Finished in 0.7s]
# 可能因为 pandas 本身调用了其他的库,这里明显感觉偏慢,杀鸡用牛刀了
总结
综上,在一般情况下,我们直接使用 Python 内置的 zip(*) 函数就可以快速实现二维矩阵转置了,当然使用其他一些专用的库也是可以的,在性能和便捷程度上做好取舍就可以了,希望对需要的朋友有帮助,感谢支持~