数据科学与R语言|tidyverse技巧(1)

这篇博客介绍了在数据科学中使用R语言tidyverse包的一些实用技巧,包括载入和更新R包、添加计数列、选择特定值、重排列变量、条件判断函数、处理缺失值以及数据汇总。通过案例展示了如何找出高分学生、进行取反操作以及使用统计图形来展示数据。
摘要由CSDN通过智能技术生成

在学习数据科学中的R语言[1]时,所做的记录,对一些内容加了注释,方便查阅。

需要载入的R包

一开始,在载入tidyverse时,发现dplyr等包的版本太低报错,在Rstudio的界面上找到packages点开,搜索,版本太低的包,卸载,然后重新安装即可,也可以用代码卸载:'remove.packages("包名")'

library(tidyverse)
# install.packages("dplyr")
library(patchwork)#如果没安装,就用install.packages()安装后再载入

 

所用的数据集

df <- tibble(
  name=c("Alice","Alice","Bob","Bob","Carol","Carol"),
  type=c("english","math","english","math","english","math"),
  score=c(60.2,95.7,98.7,89.4,76.8,92.3)
)
df

add_count()

想增加一列,代表每人参加的考试次数

df %>% 
  group_by(name) %>% 
  mutate(n=n()) %>% #增加一列通常用的方法
  ungroup()

一行代码能够实现

df %>% 
  add_count(name)#增加一列表示每个人出现的1次数

nth()、first()、last()

nth()表示选择向量或数据框的第n个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值