引言
接下来小编要分享一些 Pandas 的基础操作,可能会有些无聊,不过还是希望有兴趣的同学能对照着代码自己动手敲一下。
闲话不多聊,下面开始正题。
查看数据
前面的两篇内容中,我们介绍了 Pandas 的两种数据结构,本篇的内容将主要介绍一些有关于 DataFrame 的查找操作,毕竟 DataFrame 是一个二维类似于表一样的数据结构,我们平时会更多的使用 DataFrame 。
首先第一步还是导入 Pandas 与 NumPy ,并且要生成一个 DataFrame ,这里小编就简单的使用随机数的形式进行生成,代码如下:
import numpy as np
import pandas as pd
dates = pd.date_range('20200101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(df)
这里最后我们打印了一下这个生成的 DataFrame ,结果如下:
A B C D
2020-01-01 0.177499 -0.025693 0.182894 -1.123577
2020-01-02 1.067580 1.592576 -0.010205 -0.349342
2020-01-03 1.141218 1.032333 1.364477 0.851630
2020-01-04 0.920260 -0.243247 0.196369 -0.835655
2020-01-05 -0.729184 -0.235706 1.144007 -1.048619
2020-01-06 -0.480888 -0.995325 -0.283726 0.428644
以上我们的准备工作就完成了,已经构建了一个随机产生的 DataFrame ,接下来我们看一些简单的取值操作。
首先第一个是从头部开始取值,这里使用到的方法是 head() ,比如现在需要取出上面这个 df 中第一行的数据,那我们可以这么写:
# 查看头部数据
print(df.head(1))
结果如下:
A B C D
2020-01-01 0.177499 -0.025693 0.182894 -1.123577
既然有从头部取数那么一定会有从尾部取数,这个方法是 tail() ,用法和上面的一样,这里我们从尾部取出两行的数据,如下:
# 查看尾部数据
print(df.tail(2))
结果如下:
A B C D
2020