一张表格教会了我统计学常用的数据处理函数

函数功能
sum(x)对x中的元素求和
prod(x)对x中的元素求连乘积
max(x)x中元素的最大值
min(x)x中元素的最小值
which.max(x)返回x中最大元素的下标
which.min(x)返回x中最小元素的下标
range(x)与c(min(x), max(x))作用相同
length(x)x中元素的数目
mean(x)x中元素的均值
median(x)x中元素的中位数
var(x) or cov(x)x中元素的的方差(用n − 1做分母);如果x是一个矩阵或者一 个数据框,将计算协方差阵
cor(x)如果x是一个矩阵或者一个数据框则计算相关系数矩阵(如 果x是一个向量则结果是1)
var(x, y) or cov(x, y)x和y的协方差,如果是矩阵或数据框则计算x和y对应列的协方 差
cor(x, y)x和y的线性相关系数,如果是矩阵或者数据框则计算相关系数 矩阵。
round(x, n)将x中的元素四舍五入到小数点后n位
rev(x)对x中的元素取逆序
sort(x)将x中的元素按升序排列;要按降序排列可以用命令rev(sort(x))
rank(x)返回x中元素的秩
log(x, base)计算以base为底的x的对数值
scale(x)如 果x是 一 个 矩 阵 , 则 中 心 化 和 标 准 化 数 据 ; 若 只 进 行 中 心 化 则使用选项scale=FALSE,只进行标准化则center=FALSE(缺省值 是center=TRUE, scale=TRUE)
pmin(x,y,…)返回一个向量,它的第i个元素是x[i], y[i], . . . 中最小值
pmax(x,y,…)同上,取最大值
cumsum(x)返回一个向量,它的第i个元素是从x[1]到x[i]的和
cumprod(x)同上,取乘积
cummin(x)同上,取最小值
cummax(x)同上,取最大值
match(x, y)返回一个和x的长度相同的向量,表示x中与y中元素相同的元素在y中 的位置(没有则返回NA)
which(x == a)返回一个包含x符合条件(当比较运算结果为真(TRUE)的下标的向 量,在这个结果向量中数值i说明x[i] == a(这个函数的参数必须是 逻辑型变量)
choose(n, k)计算从n个样本中选取k个的组合数
na.omit(x)忽略有缺失值(NA)的观察数据(如果x是矩阵或数据框则忽略相应的 行)
na.fail(x)如果x包含至少一个NA则返回一个错误消息
unique(x)如果x是一个向量或者数据框,则返回一个类似的对象但是去掉所有重 复的元素(对于重复的元素只取一个)
table(x)返回一个表格,给出x中重复元素的个数列表(尤其对于整数型或者因子 型变量)
table(x, y)x与y的列联表
subset(x, …)返回x中的一个满足特定条件…的子集,该条件通常是进行比较运 算:x$V1 < 10;如果x是数据框,选项select给出要保留的变量(或 者用负号表示去掉)
sample(x, size)从x中无放回抽取size个样本,选项replace = TRUE表示有放回的抽样
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值