pyechart数据可视化丨制作桑基图(sankey)的最简单方法

前言
最近在分析超期库存数据, 每天4万条左右, 数据的特点是有很多分类变量, 为了展现这些变量的关系, 想到了桑吉图

Pyechart官网上有关于桑基图的案例, 但是如何用日常使用的excel数据整理成作图的数据, 却没有说明, 今天我们介绍下制作桑吉图的4个步骤。

本案例以泰坦尼克号乘客数据为例, 效果图如下:
在这里插入图片描述

在这里插入图片描述

1 读取数据

数据为excel表格, 前几列都为分类变量, 最后一列是需要计数或者求和的变量,在桑基图上显示为流量大小。

from pyecharts import options as opts
from pyecharts.charts import Sankey
import pandas as pd
import numpy as np
import json

data1 = pd.read_excel('./泰坦尼克数据.xlsx')
data1

在这里插入图片描述

2 整理成3列数据

数据转换成 父类→子类→值 这种格式;
从父类到子类, 每相邻的两个分类变量都需要计算. 使用pandas中数据透视表(pivot_table)方法, 计算后的数据纵向合并

# 名称列表
lis = data1.columns.tolist()[:-1]
# 两个子list
lis1 = lis[:-1]
lis2 
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

python技巧(数据分析及可视化)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值