基于R的高级数据管理

最新推荐文章于 2022-09-09 13:48:34 发布

tigerking1017

最新推荐文章于 2022-09-09 13:48:34 发布

阅读量439

点赞数

分类专栏： R 文章标签： R 数据分析统计

R 专栏收录该内容

4 篇文章 1 订阅

订阅专栏

知识点：
    数学和统计函数
    字符处理函数
    数据整合与重塑

环境：
    R version 3.3.1

问题：
    一组学生参加了数学、科学和英语考试，所有学生确定一个单一的成绩衡量指标。将前 20% 的学生评定为 A，接下来 20% 的学生评定为 B，依次类推。最后，希望按字母顺序对学生排序。

代码：

options(digits=2) #限定输出小数点后数字的位数

Student <- c("John Davis", "Angela Williams", "Bullwinkle Moose",

"David Jones", "Janice Markhammer", "Cheryl Cushing",

"Reuven Ytzrhak", "Greg Knox", "Joel England",

"Mary Rayburn")

Math <- c(502, 600, 412, 358, 495, 512, 410, 625, 573, 522)

Science <- c(95, 99, 80, 82, 75, 85, 80, 95, 89, 86)

English <- c(25, 22, 18, 15, 20, 28, 15, 30, 27, 18)

roster <- data.frame(Student, Math, Science, English,

stringsAsFactors=FALSE)

z <- scale(roster[,2:4]) #变量进行标准化

score <- apply(z, 1, mean) #计算各行的均值以获得综合得分

roster <- cbind(roster, score) #添加到花名册中

y <- quantile(roster$score, c(.8,.6,.4,.2)) #学生综合得分的百分位数

roster$grade[score >= y[1]] <- "A"

roster$grade[score < y[1] & score >= y[2]] <- "B"

roster$grade[score < y[2] & score >= y[3]] <- "C"

roster$grade[score < y[3] & score >= y[4]] <- "D"

roster$grade[score < y[4]] <- "F"

name <- strsplit((roster$Student), " ") #以空格为界把学生姓名拆分为姓氏和名字

Firstname <- sapply(name, "[", 1) #"["是一个可以提取某个对象的一部分的函数

Lastname <- sapply(name, "[", 2)

roster <- cbind(Firstname, Lastname, roster[,-1])

roster[order(Lastname,Firstname),] #依姓氏和名字对数据集进行排序

结果：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

tigerking1017 CSDN认证博客专家 CSDN认证企业博客

码龄8年

31: 原创

24万+: 周排名

44万+: 总排名

21万+: 访问

: 等级

1499: 积分

92: 粉丝

132: 获赞

12: 评论

471: 收藏

私信

关注

热门文章

分类专栏

数据治理
数据仓库 2篇
数理统计 1篇
python 19篇
MySQL 5篇
MATLAB 4篇
R 4篇
web 3篇
Spark 1篇
MongoDB 2篇
前段
技术应用 1篇

最新评论

数据集市简介
CSDN-Ada助手: 非常感谢CSDN博主分享的关于数据集市的博客，这篇博客详细介绍了数据集市的概念和作用，让读者更好地理解数据集市的重要性。我觉得下一篇博客可以深入探讨数据集市的建设和运维，分享一些实践经验和技巧，对于正在进行数据集市建设的用户会非常有帮助。希望博主可以继续分享关于数据集市的技术文章，这样更多的读者可以受益于你的经验和知识。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
MATLAB参数估计normfit()函数和mle()函数
xinleiforever: 请问可以自定义函数，用mle函数实现对两维数据进行二维高斯的最大似然估计吗？
有趣的MATLAB小程序
北辰巷墨灕: 太秀了
有趣的MATLAB小程序
张无极2018: 可以看一下我的，互相学习互粉 https://blog.csdn.net/weixin_43419816/article/details/106063588
CSS基础之框架图
zl_666: 1 2表示什么意思啊？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。