大多数时候,我们要处理分析的数据是存储在不同格式的文件中的,有txt、csv、excel、json、xml以及二进制等磁盘文件格式,还有时候是从数据库以及从Web API中交互获取要处理的数据。现在开始学习如何用pandas从以上内容中输入和输出数据。
读取和写入文本格式数据
pandas具有许多函数,用于将表格数据作为DataFrame对象读取。下面列表列出来一些常用的函数,pandas.read_csv 是最常用的方法之一。这一次主要学习从各种格式的文本文件中存取数据,后面还要学习从二进制数据格式文件中存取数据。
以下列表:pandas 中的文本和二进制数据加载函数
函数 | 描述 |
read_csv | 从文件、URL 或类似文件的对象加载分隔数据;使用逗号作为默认分隔符 |
read_fwf | 以固定宽度的列格式读取数据(即无分隔符) |
read_clipb |