问题描述
对于一个Dataframe
而言,有时候我们需要对列进行分组,并且在每个组的内部根据另一列的信息提取其他列内部的数据。比如股票价格的数据,一只股票在不同日期,每个日期的不同时间点都产生了不同的股票价格。我们如果想要得到每个日期的开盘价格、收盘价格,就需要对日期进行归类,获取时间最靠前的价格数据。
数据情况
这里我们使用一个人工产生的数据,这是Jeff Heaton教授网站的一个公开数据,通过下面的代码我们可以看到这个数据是每天不同时间点的股票数据。
import pandas as pd
df = pd.read_csv("https://data.heatonresearch.com/data/t81-558/datasets/series-31.csv")
display(df.head()