在学习数据科学中的R语言[1]时,所做的记录,对一些内容加了注释,方便查阅。
需要载入的R包
一开始,在载入tidyverse时,发现dplyr等包的版本太低报错,在Rstudio的界面上找到packages点开,搜索,版本太低的包,卸载,然后重新安装即可,也可以用代码卸载:'remove.packages("包名")'
library(tidyverse)
# install.packages("dplyr")
library(patchwork)#如果没安装,就用install.packages()安装后再载入
所用的数据集
df <- tibble(
name=c("Alice","Alice","Bob","Bob","Carol","Carol"),
type=c("english","math","english","math","english","math"),
score=c(60.2,95.7,98.7,89.4,76.8,92.3)
)
df
add_count()
想增加一列,代表每人参加的考试次数
df %>%
group_by(name) %>%
mutate(n=n()) %>% #增加一列通常用的方法
ungroup()
一行代码能够实现
df %>%
add_count(name)#增加一列表示每个人出现的1次数
nth()、first()、last()
nth()表示选择向量或数据框的第n个