一、复购率
复购率:一段时间内,购买2次及以上客户人数,占该时间段内购买过的总人数的比重。
例如:一个月以内,购买该商品超过两次的人有50个人,一个月内买过该商品的人有100个人,该月内复购率就是50%。复购率计算是要剔除那些没有该买一次的客户。
1) python实现复购率
1.建立pivot_table,index为user_id,columns为月份,value为order_dt(其他只要代表消费的字段都可以),aggfunc='count'。这里的月份是已经转化成为月的值了,
df['month']=df.order_date.values.astype('datetime64[M]')
pivot_table可以实现两列不重复的字段绘制成表格,可以对表中的值进行聚合操作。和excel有点像。
关于pivote_table:pivote_table
pivoted_counts=df.pivot_table(index='user_id',columns='month',
values='order_dt',aggfunc='count').fillna(0)
#columns_month=df.month.sort_values().astype('str').unique()
pivoted_counts.head()