《ggplot2:数据分析与图形艺术》
第5章 工具箱
5.8 揭示不确定性
数据中存在不确定性的信息,有四类几何对象可揭示数据中不确定性的信息。
具体使用哪个取决于x的值是离散型还是连续型的,以及我们是否要展示区间内的中间值,或是仅仅展示区间,见下表。
变量X类型 | 仅展示区间 | 同时展示区间和中间值 |
---|---|---|
连续型 | geom_ribbon | geom_smooth(stat=“identity”) |
离散型 | geom_errorbar | geom_crossbar |
geom_linerange | geom_pointrange |
关于标准误的计算方法很多,所以下例拟合了一个双因素含交互效应回归模型,并且展示了如何提取边际效应(marginal effects)和条件效应(conditional effects),以及如何将其可视化。
> library(ggplot2)
> d <- subset(diamonds, carat < 2.5 & rbinom(nrow(diamonds), 1, 0.2) == 1)
#满足carat < 2.5随机数==1
#rbinom(n, size, prob)#表示你的size是试验次数,n是所需满足该分布的随机数的个数,比如你要生成100个服从B(10,0.5)分布的随机数,命令就应该是 rbinom(100,10,0.5)
> d$lcarat <- log10(d$carat)
> d$lprice <- log10(d$price)
#在d这个数据框中添加两列数据分别是carat列和price列的log10的数值
> #剔除整体的线性趋势
> detrend <- lm(lprice ~ lcarat, data=d)
> detrend
Call:
lm(formula = lprice ~ lcarat, data = d)
Coefficients:
(Intercept) lcarat
3.671 1.683
> d$lprice2 <- res