Python数据可视化之绘制计数图(图文并茂版！！！)

最新推荐文章于 2023-10-17 11:34:57 发布

置顶小石y

最新推荐文章于 2023-10-17 11:34:57 发布

阅读量3.1k

点赞数 57

分类专栏： python数据可视化文章标签： python 可视化人工智能数据分析大数据

本文链接：https://blog.csdn.net/qq_45261963/article/details/118439023

版权

python数据可视化专栏收录该内容

9 篇文章 16 订阅

订阅专栏

绘制计数图

数据获取

•在上篇博客中我们介绍了绘制抖动的带状图：Python数据可视化之绘制抖动的带状图(图文并茂版！！！)
•并且也介绍了数据的来源获取，及数据分析包含数据特征值的解读等等！！

计数图的介绍

•抖动的带状图的作用就是向我们展示哪些位置存在着相同的点，根据抖动的幅度来判断各个相同点的数量的多少，现在我们学习一种和抖动的带状图作用相似的图像，叫做计数图，它是通过某个坐标点的大小(面积)来判断此点相同数量的多少！！！
•如果你的需求是将某个数据集的某两个特征值作为横纵坐标，并将所有点都展示在图像上，包括那些横纵坐标相同的点，那么你可以选择抖动的带状图或者计数图，二者皆可以！！！

绘制计数图

数据处理

       •在技术图中，坐标点的面积越大，即为该点坐标的相同数量越多，首先我么需要将我们所需的横、纵坐标取出，并统计各个（相同）坐标点的数量
       •横坐标：城市里程/加仑(cty)
       •纵坐标：公路里程/加仑(hwy)
代码测试：

import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

df = pd.read_csv(r'D:\9\mpg_ggplot2.csv')

# 数据处理
df_counts = df.groupby(['hwy', 'cty']).size().reset_index(name='counts')
print(df_counts)

运行显示：
在这里插入图片描述
•代码解读：df.groupby([‘hwy’, ‘cty’]).size() 以hwy，cty作为主键，取出所有不同的类别，size为聚合函数，将相同类别聚合在一起，.reset_index(name=‘counts’) 重新设置索引名称，当括号内的name属性为空时，索引为0，name属性为何值，则索引名称为何值：
在这里插入图片描述

绘制图像

•将数据处理与绘制图像代码整合得：

import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

df = pd.read_csv(r'D:\9\mpg_ggplot2.csv')

# 数据处理
df_counts = df.groupby(['hwy', 'cty']).size().reset_index(name='counts')


# 绘制图像
fig, ax = plt.subplots(figsize=(12, 8), dpi=80)
sns.stripplot(x=df_counts.cty
              , y=df_counts.hwy
              , sizes=df_counts.counts * 25  # 使用sizes属性而不是size
              , ax=ax
              )

# 装饰图片
plt.rcParams['font.sans-serif'] = ['Simhei']  # 设置字体为黑体
plt.xlabel('城市里程/加仑', fontsize=16)  # x轴名称
plt.ylabel('公路里程/加仑', fontsize=16)  # y轴名称
plt.xticks(fontsize=12)
plt.yticks(fontsize=12)
plt.title('Counts Plot - Size of circle is bigger as more points overlap', fontsize=20)
plt.show()

图像显示：
在这里插入图片描述

注意

•我们在设置坐标点的大小时，应该使用属性sizes而不是size，如果使用size属性会出现下述报错：
在这里插入图片描述
•解决使用size属性报错的方法参考博客：解决报错：使用seaborn绘制计数图时出现错误：ValueError: s must be a scalar, or the same size as x and y(图文并茂版！！)

总结

•在使用计数图时，应注意我们上述提到的注意点，如数据处理，sizes的选择等等！！，计数图的作用与抖动的带状图相似，遇到实际问题可自行分析，选择合适的图像进行展示数据！！！

小石y

关注

57
点赞
踩
25

收藏

觉得还不错? 一键收藏
50
评论
Python数据可视化之绘制计数图(图文并茂版！！！)

绘制计数图数据获取计数图的介绍绘制计数图数据处理绘制图像注意总结数据获取       •在上篇博客中我们介绍了绘制抖动的带状图：Python数据可视化之绘制抖动的带状图(图文并茂版！！！)       •并且也介绍了数据的来源获取，及数据分析包含数据特征值的解读等等！！计数图的介绍      &nbs
复制链接

扫一扫

专栏目录