R 绘制高密度散点图

当数据点重叠很严重时候, 用三点
摘要由CSDN通过智能技术生成

当数据点重叠很严重时候, 用散点图观察变量之间的关系就有些费劲了, 可以采用一下的方式去看观测点主要集中在那个区域。

> set.seed(1234)

> n<-10000

>c1<-matrix(rnorm(n,mean=0,sd=0.5), ncol=2)

>c2<-matrix(rnorm(n,mean=3,sd=2),ncol=2)

>mydata<-rbind(c1,c2)

>mydata<-as.data.frame(mydata)

names(mydata)<-c("x","y")

用标准的R散点图生成的图形如:

with(mydata, plot(x,y, pch=19, main="scatterplot for 10000 observations")

可以看出以上数据点的重叠,很难看出下x,y 集中在那个区域。解决的一个办法是用smoothScatter() 函数利用核密度估计生成的颜色密度来表示点分布的散点图。代码如下:

with(mydata, smoothScatter(x,y, main ="scaterplot for 10000 observations")

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
R语言绘制密度散点图的时间较长可能有以下几个原因: 首先,密度散点图是一种将散点图与密度图相结合的图表形式,需要计算出每个散点周围的密度。计算密度所需的计算量相对较大,因此会比绘制普通散点图所需的时间更长。 其次,密度散点图绘制过程中需要遍历数据集中的每个点,并计算其周围的密度。如果数据集较大,例如大量数据点或多维数据,计算过程可能会耗费更多的时间。 另外,R语言中用于绘制密度散点图的函数或包可能也会影响绘制时间。不同的函数或包在实现密度散点图的算法、优化程度等方面可能存在差异,因此绘制时间也可能会有所差异。 为了减少绘制密度散点图的时间,我们可以考虑以下几个方法: 1. 数据预处理:对于大量数据点,我们可以考虑对数据进行抽样或者使用一些数据预处理的方法来减少计算量,例如聚类、降维等。 2. 使用高效的算法或包:尽量选择使用优化程度较高的函数或包,可能会有更快的绘制速度。 3. 并行计算:对于比较复杂的计算任务,我们可以考虑使用并行计算来加速密度计算的过程。 4. 调整绘图参数:可以尝试调整绘图时的分辨率、图像大小等参数,可能会对绘制时间有所影响。 总之,绘制密度散点图所需的时间较长可能是由于密度计算的复杂性以及数据集的大小所致。通过数据处理、选择高效的算法或包、并行计算等方法,可以尝试缩短绘制时间。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值