介绍
在展示组组间差异的时候,可以选择箱线图(boxplot),但同时也可以加上圆圈暂时指标在组间的出现率,从而在一张图上展示了多种信息。
本文旨在通过R代码实现上述的可视化结果图。
加载R包
画图所需要的R包通过library
函数加载。
knitr::opts_chunk$set(echo = TRUE)
library(tidyverse)
rm(list = ls())
options(stringsAsFactors = F)
导入示例数据
本次使用的数据是R自带的iris数据对象。
data("iris")
head(iris)
处理数据
选择Sepal.Length
和Species
两列,前者作为指标变量,后者作为分组变量。分别准备画图数据和计算指标变量在各组的出现率,本次的阈值设置为5.2,其他情况下一般是0或NA。
plotdata <- iris |>
dplyr::select(Sepal.Length, Species) |>
dplyr: