基础
在用ggplot绘制散点图的时候,会有overplotting的问题。所谓的overplotting,就是在数据可视化中,当图形中的数据点过多,导致数据点重叠,难以区分和解读的现象。
为了解决这个问题,我们可以用geom_smooth来绘制拟合曲线,方便我们分析数据。
我们用到的就是geom_smooth函数。
geom_smooth
geom_smooth绘图
geom_smooth函数和geom_point函数类似,但是数据呈现的形式不一样。
比如以下代码:
ggplot(data=mpg)+geom_smooth(mapping=aes(x=displ,y=hwy))
结果如下:
解释一下,蓝线是数据拟合出来的曲线,而后的阴影部分是置信区间。如果不想要的话,在后面加上se = FALSE就可以了。
geom_smooth添加分类
如果想要把数据根据不同的类别来绘制,可以添加linetype这个参数。
如下:
ggplot(data=mpg)+geom_smooth(mapping=aes(x=displ,y=hwy,linetype=drv))
上图就根据不同的drv(传动系统类型)来绘制了三条拟合曲线。
把不同的图形绘制到一张图上
就是不停地+就好了。
举个例子,你想在散点图的基础上加上拟合曲线。
那你可以:
ggplot(data=mpg)+geom_smooth(mapping=aes(x=displ,y=hwy))+geom_point(mapping=aes(x=displ,y=hwy,color=drv))
但是你瞧,光是这个mapping=aes(x=displ,y=hwy)我就写了两遍,但其实这个参数可以写在ggplot函数里,后面+上的函数会默认继承。
所以,以上代码可以简化为:
ggplot(data=mpg,mapping=aes(x=displ,y=hwy))+geom_smooth()+geom_point(mapping=aes(color=drv))
效果是一样一样的。