30号: 关于以日期截取数据然后在连接源数据找寻结果
- Groupby如果以单一元素为排列,会直接生成Series,不好操作,所以要直接转化为DataFrame
data_min_2018=data_2018.groupby(data_2018.index.month)["日期"].min()
data_min_2018=pd.DataFrame(data_min_2018)
data_min_2018.reset_index(drop=True)
- 通过merge来连接,其中left_on 指左表的连接元素,right_on 右表所要连接的元素,how表示怎么连接
data2.reset_index(drop=True,inplace=True)
r_sum=pd.merge(data2,r,left_on="日期",right_on="日期",how="right")
r_sum.drop(["地区","品名"],inplace=True,axis=1)
- 数值标准化,由于MinMAX函数只能处理一行,如果要用处理列的数据可以用转置
for i in data.columns:
data[i]=\
MinMaxScaler().fit_transform(data[i].values.reshape(-1,1)).reshape(1,-1)[0] #数值标准化