一.更新r版本
RGUI
install.packages("installr")
require(installr)
updateR()
读取excel文件
install.packages('readxl')
library(readxl)
data <- read_excel(file.choose(),1)
常用包:
二.管道符:magrittr包
#管道符包
install.packages("magrittr")
library(magrittr)
library(tidyr)
library(tidyverse)
# 设置随机种子
set.seed(1)
# 开始
rnorm(10000) %>%
abs %>% `*` (50) %>%
matrix(ncol=100) %>%
rowMeans %>% round %>%
`%%`(7) %>% hist
数据处理包
三.dplyr包
是R语言一个用于高级数据处理的包,它对于每个基本需求都提供了一个函数,如取子集、连接、合并排序分组等等,很多函数与SQL的功能可以一一对应,对于复杂的数据集来说,dplyr包提供的函数更高效简洁。本文参考RSTUDIO以及R语言官方文档整理。
四. tidyr
用于数据处理,可以实现数据长格式和宽格式之间的相互转换,这里所指的长格式数据就是一个观测对象由多行组成,而宽数据格式则是一个观测仅由一行组成。除此之外,tidyr还可以对数据进行拆分和合并,同时也能够对缺失值进行简单的处理。tidyr的转换函数gather(宽到长)和spread(长到宽)所需参数少,逻辑上更易理解,自始至终都围绕着data,key、value三个参数来进行设定,对比其它R语言长宽格式互换的实现方式,个人认为tidyr操作性还是比较突出的。
R语言数据处理:tidyr包学习_「已注销」的博客-CSDN博客https://blog.csdn.net/m0_56444893/article/details/125212325?ops_request_misc=&request_id=&biz_id=102&utm_term=tidyr&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-4-125212325.142^v96^pc_search_result_base5&spm=1018.2226.3001.4187R语言 tidyr包的三个重要函数:gather,spread,separate的用法和举例_r语言gather-CSDN博客
https://blog.csdn.net/six66667/article/details/84888644?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170177988416800184193077%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=170177988416800184193077&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-1-84888644-null-null.142^v96^pc_search_result_base5&utm_term=tidyr%20spread&spm=1018.2226.3001.4187
五.tidyverse
类似上面两个变量