三句话画出数据分布图

最新推荐文章于 2025-09-06 09:41:46 发布

原创最新推荐文章于 2025-09-06 09:41:46 发布 · 1.7k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python

本文探讨了一种通过手动计数和循环来检查一维数据分布的方法，然后介绍了使用Seaborn库进行数据分布可视化的高效方式。Seaborn不仅简化了代码，还提供了更详细的数据洞察，帮助理解数据在不同区间内的分布情况。

我有一组数据，一维的，杂乱无章，想要快速知道数据的分布情况。最开始的想法是，弄一个数组，遍历数据落在每个区间的个数，最后画出分布，或者输出相关信息，为此我写了一个循环：

# Check the distribution
j = np.zeros(6)
jj = []
for jjj in range(len(j)):
    jj.append(np.round(pow(0.1, jjj+1), 8))
for i in range(len(f_nan_0)):
    for ii in range(len(j)):
        if f_nan_0[i] < jj[ii]:
            j[ii] += 1
print('Energy cut is:')
print('  '.join(map(str, jj)))
print('Labels below energy cut:')
print('  '.join(map(str, j)))
print('Percentage below energy cut:')
print('  '.join(map(str, np.round(j/len(f_nan_0), 4))))

输出如下：
在这里插入图片描述

数据在排序后，绘图，大概长这样：
在这里插入图片描述

以上可以满足要求，但是并不详细。我们只是大概知道数据在某些区间的个数，再具体的信息，比如，落在0.1~0.3的个数无从得知。
后来我了解了seaborn，算是matplotlib的升级版，导入seabron包以后，3句话就实现了数据发布可视化：

fig = plt.figure()
sns.displot(force)
plt.show()

结果如下：
请添加图片描述

这种方式相对于以上两种，可以反馈出更详细的信息，而且形式更简洁，就像正常的matplotlib画图一样，把plt.plot换成sns.displot即可

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

frank_haha

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

R语言ggdist_必看的数据分布类型图（眼图、半提琴图、点隔断图、梯度图、点阵图、直方图）

weixin_39372811的博客

10-30

588

此文内容来自微信公众号：R语言搬运工，扫码关注公众号浏览更多精彩内容 ggdist语言包为统计学中不确定性概率分布提供可视化途径，只要针对于频率论和贝叶斯论两个主要理论方向提供可视化作图方法。有关于这两大理论异同点，感兴趣的可以去查一下。该语言包针对于已有的数据，基于分布模型拟合方程进行绘图展示。当然，包里也提供我们对原始数据的简单视图函数，比如像我们常用的频率分布图等，下面，我们一步步的看一下该包的强大绘图功能。 ▉ 安装包 install.packages("ggdist") ▉导入使用的包 lib

matlab 泊松分布作图,matlab用一组数据画泊松分布图

weixin_29481259的博客

03-18

1634

用matlab拟合下面一组数据的曲线%xi重新取值clearx=[-2.30259,-1.60944,-1.20397,-0.91629,-0.69315,...-0.51083,-0.35667,-0.22314,-0.10536,0有一组xyz表示地形数据怎么用matlab画图采用插值法知道了一些点(x,y,z)坐标,怎样用MATLAB绘制出三维曲面?关于用matlab实现一组离散数据的傅里叶...

参与评论您还未登录，请先登录后发表或查看评论

数据分布图学习笔记~

空林长风博客

06-24

1479

本笔记主要总结了常见数据分布图形的绘制，其中包括饼图、柱状图、直方图、离散数据图、热力图、极坐标图、等高线图等。

Python数据分布类型图（箱型图、直方图）

2202_75298563的博客

06-09

6035

资料的统计图，它主要用于反映原始数据分布的特征，还可以进行多组数据分布特征的比较。箱线图的绘制方法是：先找出一组数据的上边缘、下边缘、中位数和两个四分位数；，所以在画图之前我先对所需数据进行处理，处理的方法有以下几种（list()函数、字符串转列表、tolist()等），我用的是tolist()函数。25%分位数（下四分位数）：序列中有25%的数据小于这个数。75%分位数（上四分位数）：序列中有75%的数据小于这个数。中位数（50%分位数）：序列中有50%的数据小于这个数。加入的数据必须是列表类型的。

【Python】数据可视化之分布图

Frost_Descent的博客

09-06

4159

分布图主要用来展示某些现象或数据在地理空间、时间或其他维度上的分布情况。它可以清晰地反映出数据的空间位置、数量、密度等特征，帮助人们更好地理解数据的内在规律和相互关系。

Excel数据分析：可视化图表之分布分析

uo向左的ng

11-01

9280

统计图表，用于表示数据的分布情况。又称为盒须图、盒式图或箱线图，一种用作显示一组数据分布情况，它能显示一组数据中的最小值、第一四分位数、中位数、第三四分位数和最大值来反映数据分布的中心位置和散布范围，可以粗略地看出数据是否具有对称性。气泡图是散点图的变种，通常用于展示和比较数据之间的关系和分布，它使用气泡代替散点图的数值点，面积大小代表数值大小，进而分析数据维度之间的相关性。例如，较大的值由较深的颜色表示，较小的值由较浅的颜色表示；较大的值由偏暖的颜色表示，较小的值由较冷的颜色表示。

七种数据分布图

在人生的舞台上，从不给落伍者颁发奖牌！

01-07

6485

文章目录均匀分布伯努利分布（离散）二项分布（离散）多项式分布（离散）伽马分布（连续）高斯分布（连续）正态分布（连续）均匀分布如图：代码如下： def uniform(x, a, b): y = [1 / (b - a) if a <= val and val <= b else 0 for val in x] return x, y, np...

matlab根据距离画散点图,基于Matlab的密度散点图绘制-从数据分析到完整出图

weixin_34828705的博客

03-16

2028

5-3 Seaborn 分布绘图

zkx990121的博客

12-21

1253

Seaborn 分布绘图

python 一组数据正态分布散点图_使用 R 与 python 验证是否符合正态分布

weixin_39953236的博客

11-22

1079

最近太忙了，勉强利用宾馆的两个无聊的晚上，凑成了第二篇，关于正态分布的内容，正态分布是非常重要的前提，分析前需要先检验，然后看是否需要转换。在进行真正的检验之前，我们很多时候都忽略了进行正态分布的验证。验证是否是正态分布的方法分为两类：肉眼判断假设检验肉眼判断肉眼判断当然是一句玩笑话，我们不能只凭看两眼数据就认定是否符合正态分布了，我们是通过其与正态分布的数据相比较，并不是直接做个大仙，...

一文看懂数据分析各种图形（箱型图、数据分布图、线性回归图、相关关系图）（阿里天池）

热门推荐

tangxianyu的博客

04-18

7万+

1、箱形图 1.1箱型图的定义箱型图（Boxplot）也称箱须图（Box-whiskerPlot）、盒式图或箱线图，是利用数据中的五个统计量：最小值、上四分位数、中位数、下四分位数与最大值来描述数据的一种统计图。它能够直观地显示数据的异常值，分布的离散程度以及数据的对称性。中位数：数据按从小到大顺序排列后的处于中间位置的值，如果序列是偶数个，则是中间两个数的平均值; 下四分位数Q1：位于数据序列25%位置处的数; 上四分位数Q3：位于数据序列75%位置处的数; 四分位间距IQR：..

R语言数据可视化之数据分布图（直方图、密度曲线、箱线图、等高线、2D密度图）...

大数据技术派

12-31

1万+

作者：穆晨来源：https://www.cnblogs.com/muchen/p/5310732.html阅读目录数据分布图简介绘制基本直方图基于分组的直方图绘制密度曲线绘制基本...

数据分布整理

liulingwuling的博客

06-08

2714

伯努利分布伯努利分布只有两种可能的结果，即1(成功)、0(失败)。 p=P(X=1) , q=1-p=P(X=0)。 E(X)=p D(X)=E(X^2)-[E(X)]^2=p-p^2=p(1-p)=pq 均匀分布(连续分布) 均匀分布所有可能结果为等概率。即f(x)=1/(b-a) a<=x<=b 又名矩形分布。 E(x)=(a+b)/2 D(x)=(b-a...

数据挖掘-绘制分布图

进一步有进一步的欢喜~

06-12

1308

import seaborn as sns import matplotlib.pyplot as plt for i in train.columns: try: g = sns.kdeplot(train[i], color="Red", shade = True) g = sns.kdeplot(test[i], ax =g, color="Blue"...

描述数据分布特征的五种可视化图形

lsxxx2011的专栏

01-26

1万+

还没关注？快动动手指！01 数据分布图简介中医上讲看病四诊法为：望闻问切。而数据分析师分析数据的过程也有点相似，我们需要望：看看数据长什么样；闻：仔细分析数据是否合理；问...

数据可视化系列指南之分布类图表大全

码为人生的博客

05-30

4168

分布类图表用于显示频率、数据分散在一个区间或分组的情况，使用图形的位置、大小、颜色的渐变程度来表现数据的分布，通常用于展示连续数据上数值的分布情况；对个人和企业来说是很有用的数据可视化工具，它可以辅助我们用清晰易懂的图表方式展示数据，从而更好地进行数据分析，快速做出正确的决策。同时，也要注意到此类图表的适用场景，避免在不适合的场景使用而带来错误的效果。

python数据集分布可视化_手把手教你如何使用seaborn绘图--数据集分布可视化

weixin_28769141的博客

02-10

1620

seaborn是一款基于matplotlib的图形可视化python库，它提供了一种高度交互式界面，便于用户能够做出各种有吸引力的统计图表。seaborn主要是针对统计绘图的，一般来说，seaborn能满足数据分析90%的绘图需求，它最大的特点是简单。小编今天给大家分享的就是关于如何使用seaborn绘图的内容，希望对大家有所帮助。一、常用参数二、seaborn-数据集分布可视化1.单变量分布# ...

频数分布图_特征标准化后的频数分布

weixin_35330796的博客

01-14

1278

深度学习依赖历史特征数据。特征数据的质量通过频数分布图直观表现。特征数据一般不能够直接进入神经网络，需要事前标准化处理。标准化后的特征数据，虽然可以进入训练网络了，但是，如果数据太脏，会导致网络学习过程拉长、结构庞大、甚至崩溃。故需要在标准化化前，进行数据清洗。数据清洗分为空间比较清洗、时间比较清洗。空间比较清洗，使用knn，将梯度值很大的异常数据给清洗掉；时间比较清洗，根据平稳时间序列思路，将相...

在同一画布上绘制iris数据集的两两属性之间的散点图。