目录
一、直方图介绍
条状结构 横坐标:数据的分组情况 纵坐标:各个组的数量 用于大量数据 只需要大量数据,进行分组,自动计算落在各个区间的数目 身高统计:<150 150-160 160-170 170-180 >180
二、直方图绘制
统计薪水人数最多的一个范围 统计薪水落在各个区间的数目--确定众数在哪个区间 评估这个公司大部分人的一个收入情况
1.创建画布
import matplotlib.pyplot as plt
import numpy as np
plt.figure()
2.进行绘制
#准备数据
# 薪水情况
salary = [3500, 4200, 8000, 13000, 30000, 20000, 2000, 3000, 4300, 3500, 30000]
# 指定分组情况,默认系统自动进行分组
# bins = 5
# 自定义分组
# 找到最大值,最小值 相减----极差
max = np.max(salary)
min = np.min(salary)
print(max)
print(min)
# 极差
ptp = max - min
# 指定组距 5000
# 计算
bins = math.ceil(ptp / 3000) # 向上取整
# 绘图
plt.hist(salary, bins=bins, color='r')
# 增加刻度 从最小值到最大值之间以3000为区间均匀分布
arr = np.arange(min, (3000*(bins+1)) + 1, 3000)
print(arr)
plt.xticks(arr)
3.展示图形
plt.show()
运行结果: