使用pandas-alive对“2022年冬奥运奖牌信息“可视化

简介

pandas-alive 以matplotlib绘图为后端,对pandasDataFrame对象进行绘图处理。虽然提供了很简单的绘制可视化图表机制,但是在使用的过程中,需要有特定的数据格式:

  • 数据的索引具有维度意义:例如时间, ** 当索引为整型时需考虑步长的关系,会影响数值
  • 每列包含特定类别的值

从上面的格式要求来看,用于生成可视化图表的最佳选择是:与时间有线性关系的数据集合。从文档里面给的数据源可以求证到这一点。

例子

在文档里面所列的数据都是经过了整理成合适的数据样例,数据与时间线性相关。

但是在实际生产中,很难找到能直接使用的例子。所以,在使用过程中,需要经历三个阶段:确定数据类型、数据处理、根据数据类型选择相应图表。

下面将使用从 和鲸社区 拿到的“2022年冬奥会奖牌信息” 进行例子演示:

确认数据类型

数据源为一个csv文件,以第一行作为表头,内容如下所示
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6sfYAWfS-1646286001212)(/Users/wangjiezhi/Library/Application Support/typora-user-images/image-20220225135039179.png)]

观察数据,从整体上看,与时间相关性较强的是“国家”、“时间”、“奖牌类型”,所以我们可以得到一个较简单的模型: 同种奖牌类型下的国家获得奖牌数量时间的关系。

数据预处理

从上述的表中,数据格式不符合pandas-alive绘图的要求,于是得进行一系列的数据处理。

import pandas as pd
import pandas_alive
import numpy as np


from examples.utils import get_filepath

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']  # 替换sans-serif字体
plt.rcParams['axes.unicode_minus'] = False  # 解决坐标轴负数的负
  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值