2021-04-14

R ggplot数据抖动

首先,我们先来画一个图:

ggplot(data = mpg) +geom_point(mapping = aes(x = displ, y = hwy, color = class))

在这里插入图片描述
虽然数据集中有 234 个观测值,但散点图中只显示了 126 个点?这是因为有一些点重合了,这个问题称为过绘制。点的这种排列方式很难看出数据的聚集模式,为了更加清晰的帮助我们观测数据,理解数据,数据抖动就可以派上用场了。
通过将位置调整方式设为“抖动”,可以避免这种网格化排列。 position = “jitter” 为每
个数据点添加一个很小的随机扰动,这样就可以将重叠的点分散开来,因为不可能有两个
点会收到同样的随机扰动:

ggplot(data = mpg) +geom_point(mapping = aes(x = displ, y = hwy),position = "jitter")

图在这里插入图片描述
这样,所有的数据点就都显示出来了。
此外,ggplot还专门开发了一个几何对象函数 geom_jitter(),运行下面的代码,同样可以得到上面的图。

ggplot(data = mpg) +geom_jitter(mapping = aes(x = displ, y = hwy))

数据抖动通过随机来改善图形,会使图形变的不精确,除了这种方法,也可以通过设置透明度来更好的展示有聚集情况的数据。

ggplot(data = mpg) +geom_point(mapping = aes(x = displ, y = hwy,alpha=0.8),size=3,color="red",show.legend = F)

在这里插入图片描述

参考:R数据科学

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值