R数据科学-第1章使用ggplot2进行数据可视化-1

本博客通过R语言的ggplot2库分析mpg数据集,研究引擎大小(displ)与燃油效率(hwy)之间的关系。发现二者呈负相关,大引擎汽车通常更耗油。同时,通过颜色和形状映射发现离群点主要是双座跑车,而平滑曲线和驱动系统(drv)的分类分析揭示了不同驱动方式对燃油效率的影响。
摘要由CSDN通过智能技术生成

问题:大引擎汽车比小引擎汽车更耗油吗?引擎大小与燃油效率之间有什么关系?

利用ggplot2中的mpg数据框来解决此问题。

mpg包含了由美国环境保护协会收集的39种车型的观测数据,变量信息为:

displ:引擎大小,单位为升。

hwy:汽车在高速公路上行驶的燃油效率,单位为英里/加仑。

1.观察整体趋势

> library(ggplot2)
> ggplot(data=mpg)+geom_point(aes(x=displ,y=hwy))

 图片显示引擎大小与燃油效率之间是负相关关系,引擎大的汽车更耗油。

2.分析异常值

观察可知有一部分数据处于线性趋势之外,即这些汽车有比预期更高的里程数。可以假设这些车为混合动力车,这要查看每一辆车的class。

我们可以在绘图时向二维散点图中加入第三个变量class。

方式一:为将它映射为图形属性。图形属性可以是形状、颜色、大小。

将点的颜色映射为class来揭示车的类型:

 ggplot(data=mpg)+geom_point(aes(x=displ,y=hwy,color=class))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值