什么是CSV文件,你如何在它们旁边使用Python?了解如何使用 csv 模块在 Python 中读取和使用 CSV 文件。
您以前可能看过表格数据:它只是包含一些数据的行和列。(想想文章中的表格或 Excel 电子表格。CSV 文件是数据科学家最常用的表类型之一,但如果您不知道它们的工作原理或如何与 Python 一起使用它们,它们可能会令人生畏。
在本文中,我们将了解CSV文件以及如何使用Python来处理它们。我们将首先了解CSV文件实际上是什么。然后,我们将学习使用 Python 的内置模块快速有效地读取和写入 CSV 文件。
CSV 文件的结构
简而言之,CSV 文件是表示表的纯文本文件。数据存储为行和列。名称 CSV 代表逗号分隔的值,这意味着表的列由逗号分隔。另一方面,行只是由文件中的行分隔。第一行通常是表的标题,其中包含每列中数据的描述。
让我们使用一个名为 的示例 CSV 文件。如果我们使用文本编辑器打开它,它的外观如下:people.csv
人的纯文本内容.csv。我们将在下面的示例中使用此文件。
如您所见,列由逗号定义。第一列(在标题标签下,每行中第一个逗号之前)存储每个人的姓名。在第一个逗号之后是列,然后是 ,依此类推。报价符号可用于封装文本,如列中所示。nameidageid
由于逗号不一定对齐,因此以纯文本形式可视化每一列有点困难。如果我们在Excel,Google Sheets或LibreOffice Calc等电子表格中打开CSV文件中的数据,则更容易理解:
人员.csv中的数据,如电子表格中显示的。
那就好多了!此外,请注意列中的值是如何解释为文本的。如果它们未括在引号中,则它们将被视为数字,并且在加载数据时将丢弃其前导零。id
将CSV文件作为电子表格打开可能会导致意外结果 - 例如,软件可能认为逗号是数字分隔符而不是列分隔符。某些电子表格程序(如 Excel)包含 CSV 导入功能,允许您指定列分隔符和数据类型以及其他参数。请留意以确保您不会无意中修改数据!
使用 Python 读取 CSV 文件
好的,我们对什么是CSV文件有一个基本的了解。但是你如何使用Python打开它呢?
您可能想使用该函数来读取文件的内容,在每个列分隔符处拆分行,最后将其放入列表或字典等数据结构中。(旁注:如果你还没有听说过这个函数,我们建议你阅读我们关于<