数据分析
取出退货的订单 使用透视图进行观察
df1 = df.loc[df['Quantity'] <= 0]
#使用透视图分析
tt = pd.pivot_table(df1,index=['year'],columns=['month'],values=['amount'],aggfunc={'amount':np.sum},margins=False)
取出除退货订单以外的已完成订单并观察
df2 = df[(df['Quantity'] > 0) & (df['Price'] > 0)]
#使用透视图分析
pp = pd.pivot_table(df2,index=['year'],columns=['month'],values=['amount'],aggfunc={'amount':np.sum},margins=False)
退货率=退货金额/合计金额
以2010年为例来画出退货率的折线图
#取出多列
df2010 = df[['year','month','Quantity','Price','amount']]
#取出2010年的记录
df2010 = df2010.loc[df2010['year'] == '2010']
#2010年每个月的
#合计金额
df2010_1 = df2010[(df2010['Quantity'] > 0) & (df2010['Price'] > 0)]
df2010_1 = df2010_1.groupby('month').sum()
#退货金额
df2010_0 = df2010[(df2010['Quantity'] < 0)]
df2010_0 = df2010_0.groupby('month').sum()
#2010年退货率
#退货率=退货金额/合计金额
th2010 = np.abs(df2010_0['amount']/df2010_1['amount'])
出来的结果是这样的:
顺序是错的
搜了一下怎么解决,看到一