各位知友大家好,我是飞时过,电商中的业务分析法,最火爆的就是同期群分析,因为它比二八分析,四象限分析多了时间维度,但就是这个时间维度是最需要大书特写的,因为比如说分析就业后的薪资(我应该算是离群值了,唉),2019年毕业的是没有办法和2018年毕业的在同一时间点进行比较的。这就给数据清洗提出了新的要求,需要在保证存留分析可解析的前提下,最大限度利用好透视表。
从数据上看我们需要处理的列是交易时间,每一个顾客ID,是对应不同的交易时间的,我们需要找到最初,也就是这个顾客首次出现的时间,这个时间,就是同期群分析的起点,我们还需要把后续出现的时间节点提取出来,这些时间的是客户活跃度的index,有了总的客户数量和不同时间域里的活跃客户数量,我们就能算出留存率,有了留存率我们就可以做相应的热图可视化了。
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
import datetime as dt
import missingno as msno
from textwrap import wrap
import os
os.chdir(r'G:\Pythoncode\cohort-retention-rate-analysis-in-python-main')
# Loading data