频率分布表画法
- 找出最值,计算极差(最大值-最小值)
- 合理分组,确定区间(一般分为8-12组)
- 统计每组里的数据个数
- 算出频率并作图
频率分布直方图
- 建系,横坐标为研究对象,纵坐标为频率/组距
- 计算纵坐标一频率/组距
- 画柱状图
总结:频率分布直方图每个长条的面积为(频率*组距=该范围内数据占总体的比例),所有长条面积相加为1,通过频率分布直方图可以看出数据大致的分布状态。
用seaborn实现:
(为保证与手画一致,将数据最大值,最小值分别改为了102和84)
aa = '84 84.5 85.2 85.7 86.2 86.4 86.9 87.1 87.3 87.6 87.9 88.2 88.4 88.4 88.5 88.7 89.0 89.0 89.1 89.2 89.3 89.3 89.4 89.8 90.0 90.1 90.2 \
90.3 90.4 90.6 90.7 90.8 91.1 91.1 91.1 91.4 91.7 91.7 91.7 91.8 91.9 92.1 92.5 92.5 92.7 92.7 92.8 92.8 92.9 92.9 93.0 93.1 \
93.2 93.2 93.4 93.5 93.6 93.6 93.6 93.8 93.9 94.0 94.3 94.3 94.4 94.4 94.4 94.5 94.6 94.7 94.8 94.9 95.0 95.1 95.1 95.1 95.5 \
95.6 95.6 96.0 96.2 96.3 96.4 96.5 96.8 97.0 97.2 97.3 97.3 97.9 98.3 98.4 98.7 99.2 99.3 99.4 99.5 100.7 100.9 102'
dd = aa.split()
cc = [float(i) for i in dd]
height = pd.DataFrame({'heigh':cc})
sns.histplot(height,bins=9,stat='probability')