如果你不能读取数据,你就不能处理数据。Pandas从这里开始。
本教程采用数据集下载地址:1.88 Million US Wildfires (kaggle.com)
数据集为sqlite数据库文件
夸克网盘下载地址:链接:https://pan.quark.cn/s/160d21814154 提取码:qgDj
简介
在这个微课中,您将学习有关Pandas的所有知识,Pandas是用于数据分析的最流行的 Python 库。
在这个过程中,您将使用真实世界的数据完成几个实践练习。我们建议您在阅读相应教程的同时进行练习。
在本教程中,您将学习如何创建自己的数据,以及如何使用已经存在的数据。
开始吧!
要使用Pandas,通常从以下代码行开始。
In [1]:
import pandas as pd
创建数据
pandas中有两个核心对象: DataFrame 和 Series。
DataFrame
DataFrame 是一个表。它包含一个由单个条目组成的数组,每个条目都有一个确定的值。每个条目对应一行(或记录)和一列。
例如,考虑以下简单的 DataFrame:
In [2]:
pd.DataFrame({
'Yes': [50, 21], 'No': [131, 2]})
Out[2]:
Yes | No | |
---|---|---|
0 | 50 | 131 |
1 | 21 | 2 |
在本例中,“0,No”条目的值为131。“0,Yes”条目的值为50,以此类推。
数据框架条目不仅限于整数,例如,下面这个数据框架的值是字符串:
In [3]:
pd.DataFrame({
'Bob': ['I liked it.', 'It was awful.'], 'Sue':