使用 R 语言进行统计汇总分析
统计分析是数据科学中的重要环节,而 R 语言提供了丰富的工具和包来进行统计汇总分析。本文将介绍如何使用 R 语言进行常见的统计汇总操作,并提供相应的源代码示例。
- 数据准备
首先,让我们准备一些示例数据来进行统计汇总分析。假设我们有一个包含学生成绩的数据集,包括学生姓名、科目和成绩。我们将使用一个数据框(data frame)来存储这些数据。
# 创建示例数据框
student_data <- data.frame(
姓名 = c("张三", "李四", "王五", "赵六", "钱七"),
科目 = c("数学", "英语", "数学", "物理", "英语"),
成绩 = c(90, 85, 92, 78, 88)
)
- 描述统计
描述统计是对数据进行基本的统计汇总,包括计算平均值、中位数、标准差等。在 R 语言中,我们可以使用函数如下:
- 平均值:
mean()
- 中位数:
median()
- 标准差:
sd()
下面是如何计算学生成绩的平均值、中位数和标准差的示例代码:
# 计算平均值
avg_score <- mean(student_data$成绩)
# 计算中位数
median_score <- median(student_data$成绩)
# 计算标准