【duplicated保留所有行】
df.duplicated(keep=False)
【pivot_table使用】
index = 需要groupby的东西
values = 有用的东西
columns = 放在column上的index
pd.pivot_table(df,index=[字段1],values=[字段2],aggfunc=[函数],fill_value=0)
df.groupby([字段1])[字段2].agg(函数).fillna(0)
以上两个表述完全等价
【将某个column设为index】
df.set_index('columnName', inplace=True)
【根据其中某几列合并两个dataFrame】
recordsAll = pd.merge(records1, records2, on=['symbol', 'updateDate'], how='left')
【根据值group】
series.value_counts()
【pivot的逆操作】/ 【将multiindex转化为columns】
df_pivot.stack([1,2]).reset_index()
【将daily数据按照tick数据对齐】
dateIndex = residualSys.index.date
adjfactorTick = adjfactor.reindex(index=dateIndex)
adjfactorTick.index = residualSys.index
【multiIndex: 取le