ggplot2 基于the grammar of graphics思想,通过数据集、几何对象和坐标系统建立图形。
所有的ggplot2绘图都以ggplot()开始, 默认由aes()将数据集映射至几何对象。在行尾+添加图层:几何,比例尺,坐标和面等。要将绘图保存,请使用ggsave()
完整的ggplot2图形包括:
ggplot(data,aes(...)): Create a new ggplot (required)
geom_<FUNC>(aes(...),data,stat,position): Geometric object (required)
or stat_<FUNC>(aes(...),data,geom,position): Statistical transformation (required)
coord_<FUNC>(...): Coordinate systems
facet_<FUNC>(...): Facetting
scale_<FUNC>(...): Scales
theme_<FUNC>(...): Themes
data, aes
参数可以在ggplot, geom_<FUNC>, stat_<FUNC>
任一函数中加载,aes() 控制数据中的变量映射到几何图形。aes()映射可以在ggplot()和geom图层中设置。常用参数:alpha, color, group, linetype, size
ggsave(filename, plot = last_plot(),path=NULL,width, height, units= c("in", "cm", "mm"))保存ggplot2图形,默认保存最后一个图
geom常用几何参数 | 赋值 | |
---|---|---|
color/fill | color点、线、填充区域的边界颜色; fill填充区颜色,比如条形、密度等 | color/fill=NA 消除线条或填充 |
alpha | 颜色透明度,0(完全透明)~1(不透明) | 0 <= alpha <= 1 |
linetype | 线形,有六种,1-6 | 线条形式(1:6) |
size | 点的尺寸和线的宽度 | 点的尺寸和线的宽度 |
shape | 点的形状,和pch类型相同 | 点的形状(0:25) |
position | "dodog"将分组条形图并排,"stacked"分组条形图的堆叠,“fill” 垂直的堆叠分组条形图并规范其高度相等,"jitter"抖动,减少点的重叠。 | |
binwidth | binwidth 直方图宽度 | |
基本几何图形:
geom_bar() : 条形图
geom_boxplot() : 箱线图
geom_density() : 密度图
geom_histogram() : 直方图,仅需指定x轴,记录其频数。
geom_hline() : 水平线
geom_vline() : 垂直线
geom_jitter() : 抖动点
geom_line() : 线图
geom_point() : 散点图
geom_rug() : 地毯图
geom_smooth() : 拟合曲线
geom_text() : 文字注解
geom_violin() : 小提琴图
stat参数 : bin/count/identity
- 若x为连续变量:stat= ”bin”
- 若x离散变量:stat = “count”或stat = “identity”
geom_smooth(method = "auto", formula = y ~ x)
参数:
method: 使用的平滑函数,包括:lm-线性拟合;glm-广义线性;smooth-loess;rlm-稳健线性;gam-广义相加模型。默认是smooth.
formula :光滑函数中使用的公式,默认的话就是y ~ x,还有y ~ log(x),y ~ poly(x,n) n次多项式拟合,y ~ ns(x,n)具有n个自由度的样条拟合。
se : 是否绘制置信区间(默认为TRUE)
level : 用的置信区间水平(默认为95%)
fullrange 指定拟合应涵盖全图(T)仅数据(F),默认为F。
文本参数
函数 | 参数 | |
geom_text(aes(label), nudge_x, nudge_y, check_overlap = TRUE) | x, y, label, alpha, angle, color, family, fontface, hjust, lineheight, size, vjust | |
geom_label(aes(label), nudge_x, nudge_y, check_overlap = TRUE) | x, y, label, alpha, angle, color, family, fontface, hjust, lineheight, size, vjust | 有背景框 |
参数:
nudge_x, nudge_y: 微调
check_overlap:是否过重叠
vjust,hjust: 对齐方式(0:1)
angle: 角度
lineheight:行间距
family: 字体
size: 字体大小
fontface: 字体格式(1:4, plain标准,bold加粗,italic斜体,bold.italic)
facet分面 - 刻面图
一个图变成多个并列的图,刻面图函数有:
facet_wrap(~var,ncol = n),将每个var水平排列成n列的独立图;
facet_wrap(~var,nrow = n),将每个var水平排列成n行的独立图;
facet_grid(rowvar ~ colvar) rowvar 和colvar 组合的独立图;
facet_grid(rowvar ~ .)每个rowvar水平的独立图,配置成一个单列;
facet_grid(.~ colvar) 每个colvar水平的独立图,配置成一个单行。
修改图形外观
坐标轴
在最开始的例子里,用了labs()来添加标题和修改轴标签,那有哪些自定义坐标轴的函数呢?针对连续变量和分组变量,有以下一些函数:
scale_x_continuous(),scale_y_continuous() :breaks = 指定刻度标记,labels = 指定刻度上要标记的标签,limits = 控制要展示值的范围。
scale_x_discrete(),scale_y_discrete():breaks = 对因子的水平进行放置和排序,labels = 指定标签,limits = 控制要展示哪些水平。
coord_flip() :颠倒x.y轴。
图例的修改和位置
labs(title = "boxplot of mpg",x = "",y = "Miles Per gallon",#把x轴标签去掉 fill = "value of am")
修改标题、xy轴标签、图例标题。
theme(legend.position = c(0.2,0.8))#放图例的位置;调整图例的位置。
library(ggplot2)
ggplot(midwest, aes(x=area, y=poptotal)) +
geom_point(aes(col=state), col="steelblue", size=3) + # Set color to vary based on state categories.
geom_smooth(method="lm", col="firebrick", size=2) +
coord_cartesian(xlim=c(0,0.1), ylim=c(0, 1000000)) + #放大感兴趣区域而不删除点来更改X和Y轴限制
xlim(c(0, 0.1)) + ylim(c(0, 1000000)) + #当使用xlim()和时ylim(),指定范围之外的点将被删除,并且在绘制最佳拟合线(使用geom_smooth(method='lm'))时将不考虑这些点。
labs(title="Area Vs Population", subtitle="From midwest dataset", y="Population", x="Area", caption="Midwest Demographics") +
theme(plot.title = element_text(size = 20,hjust = 0.5),
axis.title = element_text(size = 15),
axis.text = element_text(size = 10),
legend.position="None") + # remove legend
scale_color_brewer(palette = "Set1")
#更改X轴文本和刻度的位置
+ scale_x_continuous(breaks=seq(0, 0.1, 0.01), # 设置步长0.01,scale_x_continuous是连续变量。如果是日期变量,则scale_x_date可以使用。
labels = letters[1:11]) #更改labels可以更改labels轴刻度
+ scale_x_reverse()反转刻度
#自定义整个主题
+ theme_classic() #这里预设主题有多种,通过?theme_bw查看