孩子上初中时拿到过全年级一次考试所有科目的考试成绩表,正好可以用于R语言的统计分析学习。为了不泄漏孩子的姓名,就用学号代替了,感兴趣可以下载测试数据进行练习。
num class chn math eng phy chem politics bio history geo pe
0158 3 99 120 114 70 49.5 50 49 48.5 49.5 60
0442 7 107 120 118.5 68.6 43 49 48.5 48.5 49 56
0249 4 98 120 116 70 47.5 47 49 47.5 49 60
0573 9 102 113 111.5 70 47 49 49 49 49.5 60
0310 5 103 120 111.5 70 44.75 46.5 48 48 48 60
... ...
# 在windows中设置工作目录
setwd("D:/scores_test")
# 读入成绩表,第一行是header
scores <- read.table("scores.txt", header=TRUE, row.names="num")
head(scores)
str(scores) # 显示对象的结构
names(scores) # 显示每一列的名称
attach(scores)
# 给出数据的概略信息
summary(scores)
summary(scores$math)
Min. 1st Qu. Median Mean 3rd Qu. Max.
3.00 84.00 100.00 93.98 111.00 120.00
# 1st Qu. 第一个4分位数
# 选择某行
child <- scores['239',]
sum(child) #求孩子的总分
[1] 647.45