ggplot2包中绘制点图的函数有两个:geom_point和 geom_dotplot,当使用geom_dotplot绘图时,point的形状是dot,不能改变点的形状,因此,geom_dotplot 叫做散点图(Scatter Plot),通过绘制点来呈现数据的分布,对点分箱的方法有两种:点密度(dot-density )和直方点(histodot)。当使用点密度分箱(bin)方式时,分箱的位置是由数据和binwidth决定的,会根据数据进行变化,但不会大于binwidth指定的宽度;当使用直方点分箱方式时,分箱有固定的位置和固定的宽度,就像由点构成的直方图(histogram)。
bin是分箱的意思,在统计学中,数据分箱是一种把多个连续值分割成多个区间的方法,每一个小区间叫做一个bin(bucket),这就意味着每个bin定义一个数值区间,连续值会落到相应的区间中。
对点进行分箱时,点的位置(Position adjustment)有多种调整方式:
- identity:不调整
- dodge:垂直方向不调整,只调整水平位置
- nudge:在一定的范围内调整水平和垂直位置
- jitter:抖动,当具有离散位置和相对较少的点数时,抖动很有用
- jitterdodge:同时jitter和 dodge
- stack:堆叠,
- fill:填充,用于条形图
每个位置调整都对应一个函数position_xxx()。
当沿着x轴进行分箱,并沿着y轴堆叠时,y轴上的数字没有意义。
当沿x轴进行分箱并沿y轴堆叠时,由于ggplot2的技术限制,y轴上的数字没有意义。 您可以隐藏y轴(如其中一个示例中所示),也可以手动缩放y轴以匹配点数。
使用geom_dotplot()函数来绘制点图:
geom_dotplot(mapping = NULL, data = NULL, position = "identity", ...,
binwidth = NULL, binaxis = "x", method = "dotdensity",
binpositions = "bygroup", stackdir = "up", stackratio = 1,
dotsize = 1, stackgroups = FALSE, origin = NULL, right = TRUE,
width = 0.9, drop = FALSE, na.rm = FALSE, show.legend =