用户的购买周期
#shift函数:将数据移动到一定的位置
data1 = pd.DataFrame({
'a':[0,1,2,3,4,5],
'b':[5,4,3,2,1,0]
})
data1.shift(axis=0)# shift()函数默认axis=0,整体向下一定一位
data1.shift(axis=1)#整体向右一定一位
#计算购买周期(购买日期的时间差)
order_diff=df.groupby(by='user_id').apply(lambda x:x['order_date']-x['order_date'].shift())
order_diff.describe()
count 46089 mean 68 days 23:22:13.567662566 std 91 days 00:47:33.924168893 min 0 days 00:00:00 25% 10 days 00:00:00 50% 31 days 00:00:00 75% 89 days 00:00:00 max 533 days 00:00:00 Name: order_date, dtype: object
#数据可视化,转化成直方图
(order_diff/np.timedelta64(1,'D')).hist(bins=20)#/np.timedelta64(1,'D'),日期转化成天
#bins影响柱子的宽度,每个柱子的宽度=(最大值=最小值)/bins
plt.xlabel('消费周期',color='b')
plt.ylabel('消费人数',color='r')