《ggplot2:数据分析与图形艺术》
第5章 工具箱
5.4 展示数据分布
用更好的图形组合展示最佳的数据反映效果,直方图设定组距binwidth可显示更多数据变化的细节;
不同组别数据可通过直方图进行分面,不同颜色填充,频率分布的线图来区分不同组别。
> depth_dist <- ggplot(diamonds, aes(depth)) + xlim(58,68)
> depth_dist + geom_freqpoly(aes(y = ..density.., colour = cut), binwidth = 0.1)
#这里说明density说明的纵坐标是密度
#如果绘制频率多边形图,需要连续型变量,例如depth的数据,因为连续型变量适合绘制直方图,而条形图适合绘制离散型变量数据。所以geom_freqpoly()这个频率分布多边形图和geom_histogram()同理。
> ggplot(diamonds, aes(depth)) + xlim(58,68) + geom_freqpoly(aes(colour = cut), binwidth = 0.1)
#这里说明的纵坐标是count。
作为几何对象的直方图和频率多边形均使用了stat_bin统计变换。此统计变换生成了两个输出量count和density。变量count为默认值,而变量density基本