各位知友大家好,我是飞时过,电商中的业务分析法,最火爆的就是同期群分析,因为它比二八分析,四象限分析多了时间维度,但就是这个时间维度是最需要大书特写的,因为比如说分析就业后的薪资(我应该算是离群值了,唉),2019年毕业的是没有办法和2018年毕业的在同一时间点进行比较的。这就给数据清洗提出了新的要求,需要在保证存留分析可解析的前提下,最大限度利用好透视表。
从数据上看我们需要处理的列是交易时间,每一个顾客ID,是对应不同的交易时间的,我们需要找到最初,也就是这个顾客首次出现的时间,这个时间,就是同期群分析的起点,我们还需要把后续出现的时间节点提取出来,这些时间的是客户活跃度的index,有了总的客户数量和不同时间域里的活跃客户数量,我们就能算出留存率,有了留存率我们就可以做相应的热图可视化了。
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
import datetime as dt
import missingno as msno
from textwrap import