桑基图,它的核心是对不同点之间,通过线来连接。线的粗细代表流量的大小。很多工具都能实现桑基
图,比如:Excel、tableau,我们今天要用 Pyecharts 来绘制。
因为没有用户行为路径相关的公开数据,所以本次实现可视化是根据泰坦尼克号,其生存与遇难的人的
数据,来分析流向路径。学会思路,你也可以换成自己公司的用户行为埋点数据。
读取数据
数据来源:https://www.kaggle.com/c/titanic
Python学习交流Q群:906715085####
from pyecharts import options as opts
from pyecharts.charts import Sankey
import pandas as pd
data = pd.read_excel('/Users/wangwangyuqing/Desktop/train.xlsx')
data
整理数据结构:父类→子类→值
从父类到子类,每相邻的两个分类变量都需要计算,使用 Pandas 中数据透视表,计算后的数据纵向合并成三列。
Python学习交流Q群:906715085###
lis = data.columns.tolist()[:-1]
lis1 = lis[:-1]
lis2 = lis[1