【手把手陪你学R】用ggplot2包画箱线图

箱线图是什么?

箱线图(boxplot),又称箱形图或盒式图,不仅可以展示不同类别数据的平均水平差异,还能展示数据间的极值、离散程度、异常值等信息

  • 箱子的中间线,是数据的中位数,反映了数据的平均水平
  • 箱子的上下限,分别是数据的上四分位数和下四分位数,箱子包含了50%的数据,其高度在一定程度上反映了数据的离散程度
  • 箱子的上方和下方又各有一条线,分别是数据的最大和最小值,而外溢的点则可理解成为异常值

第一步 安装并载入ggplot2包

install.packages("ggplot2")   #安装ggplot2包
library(ggplot2)   #载入ggplot2包

第二步 读取Excel文件

本篇使用的数据集是规模以上服务业企业的经济效益综合指数(将标准化后的贡献率、负债率、周转率、利润率按均等赋权后计算得到,贡献率、周转率、利润率为正向指标,负债率为适中指标),并将企业按国民经济行业门类进行分类

library(readxl)   #载入readxl包,首次使用需先安装
data <- read_xlsx("C:/Users/dell-pc/Desktop/data.xlsx", sheet = "data")    #读取Excel文件,若有多张sheet需指定sheet名
head(data,10)   #输出数据集前10行

第三步 绘制箱线图

pic <- ggplot(data = data, aes(x = 行业门类, y = 经济效益综合指数, color = 行业门类))+   #指定数据集,设置坐标轴名称、类别颜色
  geom_boxplot()   #绘制箱线图
pic   #输出箱线图 

(选做)第四步 美化箱线图

pic <- ggplot(data = data, aes(x = 行业门类, y = 经济效益综合指数, color = 行业门类))+
  geom_boxplot(size = 0.8, width = 0.8, alpha = 0)+   #设置箱线尺寸、箱形宽度、异常点透明度
  geom_jitter(position = position_jitter(0.4), alpha = 0.2, size=1.5)+   #设置数据点的分散程度、透明度、尺寸
  labs(title = "服务业行业门类经济效益综合指数")   #添加图形标题
pic

(选做)第五步 其他输出形式1

pic <- ggplot(data = data, aes(x = 行业门类, y = 经济效益综合指数, color = 行业门类))+
  geom_boxplot(size = 0.8, width = 0.8, alpha = 0)+
  geom_jitter(position = position_jitter(0.4), alpha = 0.2, size=1.5)+
  labs(title = "服务业行业门类经济效益综合指数")
pic+theme_classic()

(选做)第六步 其他输出形式2

pic <- ggplot(data = data, aes(x = 行业门类, y = 经济效益综合指数))+
  geom_boxplot(aes(fill = 行业门类), size = 0.8, width = 0.8,)+
  labs(title = "服务业行业门类经济效益综合指数")
pic

★微信搜一搜“TriHub数据社”,欢迎关注获得入社福利

  • 14
    点赞
  • 86
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 可以使用 ggplot2 包在 R 语言中绘制箱线图。该包提供了强大的数据可视化功能,其中包括箱线图。您可以使用以下代码创建箱线图: ``` library(ggplot2) ggplot(data, aes(x=factor(x), y=y)) + geom_boxplot() + ggtitle("箱线图") + xlab("分类变量") + ylab("数值变量") ``` 其中,`data`是数据框,`x`是分类变量,`y`是数值变量。 ### 回答2: ggplot是一个用于绘制统计图形的R包。要绘制箱线图,你可以使用ggplot的语法和函数。 首先,你需要安装和加载ggplot包。使用以下命令安装包: install.packages("ggplot2") 加载包: library(ggplot2) 然后,你需要一个数据集来创建箱线图。假设我们有一个包含数值变量和类别变量的数据集"data"。数据集应该包含至少一个数值变量和一个类别变量来定义箱线图中的分组。 使用以下代码创建箱线图: ggplot(data, aes(x = category, y = values)) + geom_boxplot() 在这里,"category"是数据集中的类别变量的名称,"values"是数据集中的数值变量的名称。 你可以进一步自定义箱线图的外观和细节。例如,你可以添加x轴和y轴的标签、修改图表的标题、更改箱线图的颜色等。 以下是一个示例,展示如何自定义箱线图的外观: ggplot(data, aes(x = category, y = values)) + geom_boxplot(fill = "lightblue", color = "orange") + labs(title = "Boxplot", x = "Category", y = "Values") 运行以上代码后,你将得到一个简单的箱线图,它显示了每个类别变量的分布情况和离群值。你可以根据需要进一步调整和修改图表的外观。 ### 回答3: ggplot是R语言中一个用于数据可视化的包,可以用来画出各种图形,包括箱线图箱线图是一种用来展示数据集中的分布情况的图形。它可以显示数据的中位数、上下四分位数以及异常值等信息。 使用ggplot画箱线图的过程如下: 1. 首先,导入ggplot包,可以使用如下命令: ```R library(ggplot2) ``` 2. 准备数据集。假设我们有一个数据集df,包含了不同组别的数值数据,可以通过以下命令创建一个示例数据集: ```R df <- data.frame(group = rep(c("A", "B", "C"), each = 100), value = c(rnorm(100), rnorm(100, mean = 2), rnorm(100, mean = 3))) ``` 这里假设我们有3个组别(A、B、C),每个组别有100个观测值。 3. 使用ggplot函数创建一个图形对象,指定数据集df,并设置x轴为组别(group),y轴为数值(value): ```R p <- ggplot(data = df, aes(x = group, y = value)) ``` 4. 添加图层,用geom_boxplot函数来画箱线图: ```R p + geom_boxplot() ``` 5. 可以通过添加其他图层或修改参数来进一步美化图形,比如添加标题、调整轴标签等: ```R p + geom_boxplot() + labs(title = "箱线图", x = "组别", y = "数值") ``` 最后,通过执行这些命令,就可以在R中画出箱线图。 当然,ggplot还提供了许多其他参数和选项,可以用来调整箱线图的样式和外观。想要更进一步了解ggplot的使用细节,可以查阅其官方文档或者参考相关教程。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值