概述
在深入研究数据科学和模型构建之前,Python中的数据结构是一个需要学习的关键内容
了解Python提供的不同数据结构,包括列表、元组等
介绍
数据结构听起来是一个非常直截了当的话题,但许多数据科学和分析的新手并不知道它是什么,当我询问这些人关于Python中不同的数据结构以及它们是如何工作的时,他们一片空白。
Python是一种很容易学习的编程语言,但是我们需要先弄清楚我们的基本知识,然后再深入研究有吸引力的机器学习。这是因为在我们执行的每一个数据探索任务背后,甚至我们采取的分析步骤背后,都有一个数据存储和组织的基本元素。
而且这是一个无需考虑的问题——当我们高效地存储数据时,提取信息会变得非常容易,由于我们的代码运行得更快,我们节省了大量的时间——谁不希望这样呢?
所以我希望你掌握Python中的数据结构。
在本文中,我们将探讨Python中的基本内置数据结构,当你在现实世界中处理数据时,这些结构将非常有用。所以无论你是数据科学家还是分析师,这篇文章对你来说都同样重要。
目录
Python中的数据结构
数据结构1:Python中的列表
-
创建列表
访问列表元素
在列表中追加值
从列表中删除元素
排序列表
串联列表
列表推导式
使用列表堆栈和队列
数据结构2:Python中的元组
-
在Python中创建元组
元组的不变性
元组赋值
更改元组值
数据结构3:Python中的字典
-
生成字典
访问键和值
数据结构4:Python中的集合
-
从集合中添加和删除元素
集合的操作
Python中的数据结构
数据结构是高效存储和组织数据的一种方法,它允许你轻松访问和执行数据操作。
在数据结构方面,没有一种适合所有类型的模型。你将需要以不同的方式存储数据,以满足一时需要。也许你想把所有类型的数据存储在一起,或者你想要一些更快的数据搜索,或者一些只存储不同数据项的东西。
幸运的是,Python有许多内置的数据结构,可以帮助我们轻松地组织数据,因此有必要先了解这些,以便我们在处理数据时,确切地知道哪些数据结构将有效地解决我们的目的。
数据结构1:Python中的列表
Python中的列表是最通用的数据结构,它们用于存储异构数据项,从整数到字符串,甚至是另一个列表!它们也是可变的,这意味着即使在创建列表之后,它们的元素也可以更改。
创建列表
列表是通过将元素括在[]内创建的,每个项用逗号分隔:
由于列表中的每个元素都有自己不同的位置,因此在列表中具有重复的值不是问题:
访问列表元素
我们使用索引来访问列表的元素。列表中的每个元素都有一个与其相关的索引,这取决于它在列表中的位置。列表的第一个元素有索引0,下一个元素有索引1,依此类推。列表的最后一个元素的索引小于列表的长度。
但索引不一定总是正的,也可能是负的。你认为负索引意味着什么?
正索引从列表起始位置开始计数,而负索引从列表末尾开始计数。如果我们想从列表的末尾返回第n个元素,这就避免了我们必须执行的琐碎计算。因此,对于列表的最后一项,我们不需要返回List_name[len(List_name)-1]