《ggplot2:数据分析与图形艺术》笔记
第一章 简介
ggplot2的理论基础:图形图层语法, 是由Wilkinson(2005)创建的一套用来描述所有统计图形深层特征的语法规则, Wickman(2010)提出了基于Wilkinson语法的图层图形语法,将图层作为主要的考察对象,并使其嵌入到R中。
图形图层语法告诉我们,一张统计图形就是从数据到几何对象(geometric object,缩写为geom,包括点、线、条形等)的图形属性(aesthetic attributes,缩写为aes,包括颜色、形状、大小等)的一个映射。此外,图形中还可能包括数据的统计变换(statistical transformation,缩写为stats),最后绘制在某个特定的坐标系(coordinate system,缩写为coord)中,而分面(facet)则可以用来生成数据不同子集的图形。
一个图形对象就是一个包含数据、映射、图层、标度、坐标和分面的列表。
第四章 用图层构建图像
绘图的方式有两种:一是一步到位式,如qplot()命令,二是逐层叠加式,如ggplot()函数和图层函数。一个图形可能包含多个图层。
一个图层由五个部分组成:
- 数据 :必须是一个数据框,在绘图结束后可以被修改。
- 一组图形属性映射 :用来设定数据集中的变量如何映射到该图层的图形属性。
- 几何对象:用来指定在图层中用哪几种几何对象来绘图。
- 统计变换 :对原始数据做一些有用的统计变换,返回一个包含新变量的数据框。
- 位置调整:通过调整元素位置来避免图形重合。
图层是普通的R对象,可以存储到变量中去,有利于代码的避繁就简。
比较下面两条命令的区别:
ggplot