当变量值个数较多时,对各变量值出现的频率列表即为频率分布表,简称频率表。 频率分布直方 图是频率分布表的图形表示,可以帮 助研究者发现某些离群值或极端值,更好地揭示变量的分 布类型(对称分布、正偏锋分布、负偏峰分布)与分布特征(集中 趋 势、离散 趋势 ),为研 究者进一步计算统计指标和统计分析提供方便。 本 文将 基于R语言对定量 变量频率分布 图的绘制进行讲解。
离散型变量
ggplot2是R语言中用于数据可视化的重要程序包,在使用前需要在RStudio console中运行 install.packages(ggplot2)进行安装。利用R语言绘制离散型变量频率分布直方图的代码如下:library(ggplot2)# 构造数据
data data rpois(1000, lambda = 10)
df data.frame(wrong=data)# 绘制频率分布直方图
ggplot(df, aes(wrong)) +
geom_histogram(aes(y = stat(count) / sum(count)), binwidth = 1, fill = "#F9A825", color = "#FFFDE7", alpha = 0.5) +
labs(x = "错误次数", y = "人数占比") +
theme_bw() +