Python统计数组中多个区间内的频数并画直方图

最新推荐文章于 2023-12-20 18:49:40 发布

Cyril_KI

最新推荐文章于 2023-12-20 18:49:40 发布

阅读量1w

点赞数 23

分类专栏： Python 文章标签： pandas cut dataframe 直方图

本文链接：https://blog.csdn.net/Cyril_KI/article/details/126208900

版权

Python 专栏收录该内容

26 篇文章

订阅专栏

需求

给定一个数据数组或列表，如[1, 2, 2, 3, 5, 5, 7, 7.5, 9.5, 10] ，然后给定一个区间数组：[0, 4, 8, 10]，要求依次统计数据数组在(0, 4]，(4, 8]以及(8, 10]三个区间内各自出现的频数，并画出直方图。

实现

首先随机生成0到10之间的100个整数：

data = np.random.randint(low=1, high=10 + 1, size=100, dtype='int')
print(data)

输出：

[ 8  7  1  9  8  7  8  7  7  8  3  6 10 10  9  2  2 10  1  2  2  6  6  2
  7  4  5  5  8  6  5  4  3  2  8  4  3  5 10  5  9  6  4  5  4  2  8  9
  7  8  7  9  7  4  2  7  7  6  3  3  6  7  8  1 10  7  7 10  4  4  6  4
  5  5 10  7  1  2  8  4  6  8  9  9  6  4  9  5  6  4  4 10  2  6  9  3
  4  8  4  9]

统计频数用pandas的cut函数可以很轻松地实现：

s = pd.cut(data, bins=[x for x in range(10 + 1)])
print(s.value_counts())

其中bins表示区间数据。如前文所述，如果bins=[0, 4, 8, 10]，那么就是统计data在(0, 4]，(4, 8]以及(8, 10]三个区间内各自出现的频数。

统计结果输出：

(0, 1]      9
(1, 2]      7
(2, 3]      7
(3, 4]      4
(4, 5]     12
(5, 6]     10
(6, 7]     14
(7, 8]      9
(8, 9]     18
(9, 10]    10
dtype: int64

然后获取频数：

values = s.value_counts().values
print(values)
[ 7  9 12 10  9 11 10 13  7 12]

获取横轴标签：

labels = [str(i) + '-' + str(i+1) for i in range(int(np.max(data)))]
print(labels)
['0-1', '1-2', '2-3', '3-4', '4-5', '5-6', '6-7', '7-8', '8-9', '9-10']

最后，生成dataframe并画图：

df = pd.DataFrame(values, index=labels)
df.plot(kind='bar', legend=False)
plt.xticks(rotation=0)
plt.ylabel('频数')
plt.xlabel('区间')
plt.show()

结果：
在这里插入图片描述

Python统计数组中多个区间内的频数并画直方图

目录

需求

实现