R 绘制高密度散点图

当散点图中的数据点重叠严重时,可以使用R语言的smoothScatter()、hexbin包的hexbin()、IDPmisc包的iplot()以及ggplot2的qplot()函数来创建颜色密度图和六边形网格图,以更好地显示数据分布。这些方法能有效地揭示高密度区域,帮助理解数据集的集中趋势。
摘要由CSDN通过智能技术生成

当数据点重叠很严重时候, 用散点图观察变量之间的关系就有些费劲了, 可以采用一下的方式去看观测点主要集中在那个区域。

> set.seed(1234)

> n<-10000

>c1<-matrix(rnorm(n,mean=0,sd=0.5), ncol=2)

>c2<-matrix(rnorm(n,mean=3,sd=2),ncol=2)

>mydata<-rbind(c1,c2)

>mydata<-as.data.frame(mydata)

names(mydata)<-c("x","y")

用标准的R散点图生成的图形如:

with(mydata, plot(x,y, pch=19, main="scatterplot for 10000 observations")

可以看出以上数据点的重叠,很难看出下x,y 集中在那个区域。解决的一个办法是用smoothScatter() 函数利用核密度估计生成的颜色密度来表示点分布的散点图。代码如下:

with(mydata, smoothScatter(x,y, main ="scaterplot for 10000 observations")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值