问题:大引擎汽车比小引擎汽车更耗油吗?引擎大小与燃油效率之间有什么关系?
利用ggplot2中的mpg数据框来解决此问题。
mpg包含了由美国环境保护协会收集的39种车型的观测数据,变量信息为:
displ:引擎大小,单位为升。
hwy:汽车在高速公路上行驶的燃油效率,单位为英里/加仑。
1.观察整体趋势
> library(ggplot2)
> ggplot(data=mpg)+geom_point(aes(x=displ,y=hwy))
图片显示引擎大小与燃油效率之间是负相关关系,引擎大的汽车更耗油。
2.分析异常值
观察可知有一部分数据处于线性趋势之外,即这些汽车有比预期更高的里程数。可以假设这些车为混合动力车,这要查看每一辆车的class。
我们可以在绘图时向二维散点图中加入第三个变量class。
方式一:为将它映射为图形属性。图形属性可以是形状、颜色、大小。
将点的颜色映射为class来揭示车的类型:
ggplot(data=mpg)+geom_point(aes(x=displ,y=hwy,color=class))