ggplot2是《The Grammar of Graphics》/《图形的语法》中提出了一套图形语法,将图形元素抽象成可以自由组合的要素,类似Photoshop中的图层累加,ggplot2将指定的元素/映射关系逐层叠加,最终形成所图形。更加深入学习ggplot2,请参考《ggplot2: 数据分析与图形艺术》。
目 录
引言:ggplot2基本要素
1. 数据(Data)和映射(Mapping)
2、几何对象(Geometric)
3、标度(Scale):fill、color、shape
4、统计变换(Stat)
5、坐标系统(Coordinante)
6、分面(Facet)
7、主题(Theme)
8、实例:0-1分色
附:ggplot2函数速查表
引言:ggplot2基本要素
“+”和“%+%”
数据(data)和映射(mapping):想要可视化的数据(data)以及一系列将数据中的变量对应到图形属性的映射(mapping);ggplot2的数据(data)必须是一个数据框(dataframe)。
几何对象(geometric):几何对象(geom)代表你在图中实际看到的元素,如点、线、多边形等。
统计变换(statistics):统计变换(stat)是对数据进行的某种汇总。例如将数据分组计数以创建直方图,或将一个二维的关系用线性模型进行解释。统计变换是可选的,但通常非常有用。
标度(Scale):标度(scale)的作用是将数据的取值映射到图形空间,例如用颜色、大小或形状来表示不同的取值。展现标度的常见做法是绘制图例和坐标轴——它们实际上是从图形到数据的一个映射,使你可以从图形中读取原始的数据。标度包括位置、颜色、大小、形状、线型。
坐标系统(Coordinate):坐标系(coord)描述了数据是如何映射到图形所在的平面的,它同时提供了看图所需的坐标轴和网格线。我们通常使用的是笛卡尔坐标系,但也可以将其变换为其它类型,如极坐标和地图投影。
图层(Layer):图层的作用是生成在图像上可以被人感知的图形。一个图层由4部分组成:数据和图形属性映射;一种统计变换;一种几何对象;一种位置调整方式。
分面(Facet):分面(facet)描述了如何将数据分解为各个子集,以及如何对子集作图并联合进行展示。分面也叫作条件作图或网格作图。
其中各要素通过“+”以图层(layer)的方式来粘合构图(可以简单理解为要素/图层叠加符号);另外在ggplot2中,数据集必须为数据框(data.frame)格式,并且可以通过%+%符号调整已有数据集(ggplot2指导文档中明确写出“To override the data, you must use %+%”,也就是覆盖数据必须通过%+%)。以mpg数据集为例。
library(ggplot2)#绘制基本ggplot图base p1 "图1") #如图#用%+%调整映射关系中的数据base # To override the data, you must use %+% #也即覆盖原始数据必须通过%+%p2 "p") + labs(title=#第二种调整数据的方法list# Alternatively, you can add multiple components with a list.# This can be useful to return from a function.p3 base + ###########一页多图########library(grid)grid.newpage() ##新建页面pushViewport(viewport(layout = grid.layout(2,2))) #将页面分成2*2矩阵vplayout function(x,y){ print(p1, vp = vplayout(1,1)) #(1,1)的位置画图1print(p2, vp = vplayout(1,2)) #(1,2)的位置画图2print(p3, vp = vplayout(2,1)) #(2,1)的位置画图3
1. 数据(Data)和映射(Ma