数据处理大杀器：Python Collections 模块全攻略

最新推荐文章于 2024-05-12 18:46:34 发布

bagell

最新推荐文章于 2024-05-12 18:46:34 发布

阅读量1k

点赞数 21

文章标签： python 数据库前端数据分析数据挖掘开发语言分类

本文链接：https://blog.csdn.net/bagell/article/details/135458621

版权

本文详细介绍了Python的collections模块，包括命名元组、计数器、默认字典、双端队列、链表、堆队列以及用户自定义键排序，展示了如何利用这些工具提升数据处理效率和代码可读性。

摘要由CSDN通过智能技术生成

Python 的 collections 模块提供了丰富的数据结构和工具，可以更高效地处理各种数据。这个模块中包含了众多数据结构，如命名元组、计数器、默认字典等，以及一些高级数据处理工具。本文将深入探讨 collections 模块，展示如何使用它来解放数据处理能力。

命名元组（Named Tuples）

命名元组是具名的元组，可以创建更具可读性的数据结构。可以为元组的字段分配名称，这样可以更清晰地访问和操作元组的数据。

from collections import namedtuple

# 创建命名元组类
Person = namedtuple('Person', ['name', 'age', 'country'])

# 创建命名元组对象
person1 = Person('Alice', 30, 'USA')
person2 = Person('Bob', 25, 'Canada')

# 访问命名元组字段
print(person1.name)  # 输出：'Alice'
print(person2.country)  # 输出：'Canada'

计数器（Counter）

Counter 是一个强大的工具，用于计算可迭代对象中元素的频率。可以用它轻松统计列表、字符串或任何可迭代对象中元素的出现次数。

from collections import Counter

# 创建一个计数器对象
data = [1, 2, 3, 1, 2, 3, 1, 2, 1, 1]
counter = Counter(data)

# 统计元素出现的次数
print(counter[1])  # 输出：4
print(counter[2])  # 输出：3

默认字典（DefaultDict）

defaultdict 是字典的一个变种，它允许为字典的键设置默认值。当访问不存在的键时，defaultdict 会返回默认值而不是引发 KeyError 异常。

from collections import defaultdict

# 创建一个默认字典，所有键的默认值为0
data = defaultdict(int)
data['a'] = 1
data['b'] = 2

# 访问不存在的键，返回默认值0
value = data['c']
print(value)  # 输出：0

双端队列（Deque）

双端队列（deque）是一个高效的数据结构，支持从两端添加和弹出元素。它比列表在频繁插入和删除元素时性能更好。

from collections import deque

# 创建双端队列
queue = deque([1, 2, 3])

# 从左边添加元素
queue.appendleft(0)

# 从右边弹出元素
value = queue.pop()

print(queue)  # 输出：deque([0, 1, 2])
print(value)  # 输出：3

链表（ChainMap）

ChainMap 可以将多个字典合并成一个逻辑上的字典。这使得可以在多个字典上执行操作，而不需要复制数据。

from collections import ChainMap

dict1 = {'a': 1, 'b': 2}
dict2 = {'b': 3, 'c': 4}

# 创建 ChainMap
chain = ChainMap(dict1, dict2)

# 访问合并后的字典
print(chain['a'])  # 输出：1
print(chain['b'])  # 输出：2
print(chain['c'])  # 输出：4

堆队列（Heap Queue）

heapq 模块实现了堆队列算法，它是一种优先队列的变种。堆队列允许快速获取最小（或最大）元素，适用于许多排序和调度问题。

import heapq

# 创建一个堆
heap = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]

# 将列表转换为最小堆
heapq.heapify(heap)

# 弹出最小元素
min_element = heapq.heappop(heap)
print(min_element)  # 输出：1

用户自定义键排序

collections 模块中的 sorted 函数可以根据元组中的某个键来排序列表。

from collections import namedtuple

# 创建命名元

组类
Person = namedtuple('Person', ['name', 'age'])

# 创建对象列表
people = [Person('Alice', 25), Person('Bob', 30), Person('Charlie', 20)]

# 根据年龄排序
sorted_people = sorted(people, key=lambda x: x.age)
print(sorted_people)

总结

collections 模块为Python开发者提供了许多强大的数据结构和工具，可以大大简化数据处理过程。本文涵盖了其中一些重要的工具，如命名元组、计数器、默认字典、双端队列、链表、堆队列以及自定义键排序。这些工具为数据处理和算法解决方案提供了极大的便利，帮助提高代码的可读性和性能。通过熟练运用 collections 模块，可以更加高效地处理各种数据，并且提升编程技能。

如果你对Python感兴趣，想要学习python，这里给大家分享一份Python全套学习资料，都是我自己学习时整理的，希望可以帮到你，一起加油！

😝有需要的小伙伴，可以V扫描下方二维码免费领取🆓

1️⃣零基础入门

① 学习路线

对于从来没有接触过Python的同学，我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。
在这里插入图片描述

② 路线对应学习视频

还有很多适合0基础入门的学习视频，有了这些视频，轻轻松松上手Python~
在这里插入图片描述

③练习题

每节视频课后，都有对应的练习题哦，可以检验学习成果哈哈！
在这里插入图片描述

2️⃣国内外Python书籍、文档

① 文档和书籍资料

在这里插入图片描述

3️⃣Python工具包+项目源码合集

①Python工具包

学习Python常用的开发软件都在这里了！每个都有详细的安装教程，保证你可以安装成功哦！
在这里插入图片描述

②Python实战案例

光学理论是没用的，要学会跟着一起敲代码，动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。100+实战案例源码等你来拿！
在这里插入图片描述

③Python小游戏源码

如果觉得上面的实战案例有点枯燥，可以试试自己用Python编写小游戏，让你的学习过程中增添一点趣味！
在这里插入图片描述

4️⃣Python面试题

我们学会了Python之后，有了技能就可以出去找工作啦！下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。
在这里插入图片描述

上述所有资料 ⚡️ ，朋友们如果有需要的，可以扫描下方👇👇👇二维码免费领取🆓

bagell

关注

21
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
数据处理大杀器：Python Collections 模块全攻略

模块中的sorted函数可以根据元组中的某个键来排序列表。# 创建命名元组类# 创建对象列表# 根据年龄排序模块为Python开发者提供了许多强大的数据结构和工具，可以大大简化数据处理过程。本文涵盖了其中一些重要的工具，如命名元组、计数器、默认字典、双端队列、链表、堆队列以及自定义键排序。这些工具为数据处理和算法解决方案提供了极大的便利，帮助提高代码的可读性和性能。通过熟练运用模块，可以更加高效地处理各种数据，并且提升编程技能。
复制链接

扫一扫