目录
1.运行类
多行文字块注释与取消注释:ctrl+shift+c
清屏:ctrl+L
2.计算类
- 取一个矩阵的行数、列数:nrow(),ncol()
- 判断是否为空值:is.na()、is.nan() 结果返回一个逻辑值
- 数据排序:order()——可返回一列数据按升序排列的位次顺序,加参数decreasing = T,降序排列;order(d$a)对数据框按某一列a进行排序
- 取均值:
mean(),参数na.rm = T 表示去掉NA值,F表示不去
计算行均值/列均值:rowMeans(), colMeans()
除此之外, 使用apply函数, 也可以计算. 而且更灵活.
> args(apply)
function (X, MARGIN, FUN, ...)
其中:x为矩阵,MARGIN用来指定是对行运算还是对列运算,MARGIN=1表示对行运算,MARGIN=2表示对列运算,FUN用来指定运算函数, ...用来给定FUN中需要的其它的参数,例如:
> apply(A,1,sum)
[1] 22 26 30
计算每行的数学期望.
> apply(A,1,mean)
[1] 5.5 6.5 7.5
- 转置矩阵:t(a)
- 小数取整:
round() 传统的四舍五入,默认近似到整数,使用参数digit = n,来近似到第n位小数
signif() 与上一致,不管小数点位多少位,是保留几位有效数字
ceiling() 向上取整,floor() 向下取整,trunc()向靠近0的那一侧取整
- 重复序列的生成:rep()
rep(c(), times = n, each = m, length = a):三个参数
times:连续的c()序列出现的次数
each:每个要素自己出现的次数,排列在一起
length:生成的序列的总长度
> rep(c(1,2,3), times = 2)
[1] 1 2 3 1 2 3
> rep(c(1,2,3), each = 2)
[1] 1 1 2 2 3 3
> rep(c(1,2,3), length = 8)
[1] 1 2 3 1 2 3 1 2
3.字符串
- 提取字符:
substring(x,first,last)
- 分割字符串:
strsplit(x, split, fixed = F, perl = F, useBytes = F)
- 分割一列变量为多列:
(2条消息) R中根据匹配原则将一列拆分为几列的方法_weixin_34144848的博客-CSDN博客
str_split_fixed
library(stringr)
str_split_fixed
4.更新R
install.packages("installr")
library(installr)
updateR()
5.文件操作
获取所有某一类型文件:
filenames = list.files( path = filepath, pattern = ".csv")
复制文件到另一个文件夹:
file.copy(from = file.path(from_dir, the_files), to = file.path(to_dir, the_files))