1. 知识要点
ggplot2图像的3个基本构成
- 数据
- 图形属性映射,设定变量如何映射到图层的图形属性上
- 几何对象,至少一层,用于指定绘图所用的几何对象
ggplot(mpg, aes(x=displ, y=hwy)) + geom_point()
- 数据:mpg
- 图形属性映射:发动机尺寸对应x轴,耗油量对应y轴
- 几何对象:散点图
需要注意的是:数据和图形属性映射包含在ggplot()函数中,再通过+添加图层
因为绝大多数图像都会先将变量映射到x和y上,所以aes()中前两个变量默认映射为x和y
ggplot(mpg, aes(displ, hwy)) + geom_point()
2. 颜色、大小、形状和其它图形属性
可以使用英式拼写或美式拼写
这些图形属性的设置方法与x和y相同,而且同样需要写入aes()函数中
aes(displ, hwy, color = class)
aes(displ, hwy, shape = drv)
aes(displ, hwy, size = cyl)
ggplot2通过标度可以将数据(如汽车驱动系统“f”、“r”、“4”)转换为图形属性(如“红色”、“黄色”、“绿色”)。图像中每一个标度都对应着一个图形属性的映射。它会生成指南、坐标轴或图例
将车辆类型变量映射为颜色
ggplot(mpg, aes(displ, cty, color = class)) + geom_point()
每个点的颜色都对应着它的车辆类型
如果想给某一图形属性赋固定值而不使用标度,把相应代码写在aes()函数外侧就可以了
ggplot(mpg, aes(displ, hwy)) + geom_point(aes(color = "blue"))
ggplot(mpg, aes(displ, hwy)) + geom_point(color="blue")
不同类别的变量应该对应不同类型的图形属性
分类变量常映射为颜色和形状,连续型变量常对应大小
注意图形属性不是越多越好,要注意删繁就简,避免杂乱
3. 分面
分面同样可以在图像中展示分类变量,分面会将数据分隔为若干子集,然后创建图形的矩阵,再把每一个子集绘制到图形矩阵的窗格中
分面可以分为2种类型
- 网格型
- 封装型(更常用)
对图像进行分面处理只需加入代码facet_wrap(),括号种输入~和分类变量
ggplot(mpg, aes(displ, hwy)) + geom_point() + facet_wrap(~class)
4. 几何对象
geom_smooth() 拟合一条平滑曲线,并将曲线和标准误展示在图中
geom_boxplot() 绘制箱线图,用以概括一系列点的分布情况
geom_histogram() geom_freqpoly() 展示连续型变量的分布
geom_bar() 绘制分类变量的分布情况
geom_path() geom_line() 在数据点之间绘制连线。折线图只能创建从左到右的连线,路径图可以是任意方向的,折线图常用于描绘数据随时间变化的趋势