IO 基础 - 第 3 页 使用 Python 和 Pandas 进行数据分析教程

Pandas I/O 教程摘要:使用 Quandl 获取房价数据本教程介绍了 Pandas 中的 I/O 功能,即如何读取和写入不同格式的数据。视频首先强调了 Pandas I/O 的简便性,即使处理 CSV、文本、HDF、XLS、HTML 和 SQL 等不同格式的文件,也只需一行代码即可导入数据到 DataFrame 中。教程以 Quandl 网站为例,展示了如何获取房价数据。Quandl 提供大量经过规范化的数据集,涵盖各个领域。视频展示了如何通过 Quandl 网站搜索 Austin, Texas 的房价数据,并找到一个从 1975 年开始的 Zillow 房价指数数据。最后,视频介绍了 Quandl 网站上的数据导出功能,包括直接下载数据和使用 Python 库获取数据。教程还强调了 Quandl 网站提供的 API 功能,以及使用 Quandl API 获取数据的简便性。总体而言,本教程介绍了 Pandas 的 I/O 功能,并通过实际案例展示了如何使用 Quandl 网站获取房价数据。教程内容简洁易懂,并为后续学习 Quandl API 和更深入的数据分析提供了基础。

欢迎来到 Pandas 和 Python 数据分析的第三部分。 在本教程中,我们将开始讨论 Pandas 的 IO,即输入/输出,并从一个实际的用例开始。 为了获得充足的练习,一个非常有用的网站是 Quandl。 Quandl 包含大量免费和付费数据源。 这个网站很棒的原因是数据通常是标准化的,都在一个地方,并且提取数据的操作方法相同。 如果您使用的是 Python,并且通过他们的简单模块访问 Quandl 数据,那么数据会自动返回到数据框。 为了本教程的目的,我们将手动下载一个 CSV 文件,用于学习目的,因为您找到的并非所有数据源都将有一个漂亮整洁的模块来提取数据集。 假设我们有兴趣在德克萨斯州奥斯汀购买或出售房屋。 那里的邮政编码是 77006。 我们可以查看当地的房屋清单,看看当前的价格,但这并没有真正给我们提供任何实际的历史信息,所以让我们尝试获取一些关于这方面的数据。 让我们查询“住宅价值指数 77006”。 当然,我们可以在这里看到一个指数。 有顶层、中层、底层、三居室等等。 假设我们有一个三居室的房子。 让我们看看。 事实证明,Quandl 已经提供了图表,但无论如何让我们获取数据集,制作我们自己的图表,也许做一些其他分析。 转到下载,然后选择 CSV。 Pandas 能够与 csv、excel 数据、hdf、sql、json、msgpack、html、gbq、stata、剪贴板和 pickle 数据进行 IO 操作,而且列表还在不断增长。 查看 IO 工具文档以获取当前列表。 将该 CSV 文件移动到本地目录(您当前正在工作的目录 / 存放此 .py 脚本的目录)。 本教程的示例代码和文本撰写:http://pythonprogramming.net/input-output-data-analysis-python-pandas-tutorial/http://pythonprogramming.net

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sentdex

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值