一张表格教会了我统计学常用的数据处理函数

最新推荐文章于 2022-03-13 16:52:25 发布

「已注销」

最新推荐文章于 2022-03-13 16:52:25 发布

阅读量444

点赞数

分类专栏： R - Biostatistics 生物统计学文章标签：统计学生物学 r语言

本文链接：https://blog.csdn.net/qq_42937176/article/details/105589953

版权

R - Biostatistics 同时被 2 个专栏收录

16 篇文章 3 订阅

订阅专栏

生物统计学

11 篇文章 1 订阅

订阅专栏

                    
                        
                    
                    函数功能
sum(x)对x中的元素求和
prod(x)对x中的元素求连乘积
max(x)x中元素的最大值
min(x)x中元素的最小值
which.max(x)返回x中最大元素的下标
which.min(x)返回x中最小元素的下标
range(x)与c(min(x), max(x))作用相同
length(x)x中元素的数目
mean(x)x中元素的均值
median(x)x中元素的中位数
var(x) or cov(x)x中元素的的方差（用n − 1做分母）；如果x是一个矩阵或者一 个数据框，将计算协方差阵
cor(x)如果x是一个矩阵或者一个数据框则计算相关系数矩阵（如 果x是一个向量则结果是1）
var(x, y) or cov(x, y)x和y的协方差，如果是矩阵或数据框则计算x和y对应列的协方 差
cor(x, y)x和y的线性相关系数，如果是矩阵或者数据框则计算相关系数 矩阵。
round(x, n)将x中的元素四舍五入到小数点后n位
rev(x)对x中的元素取逆序
sort(x)将x中的元素按升序排列；要按降序排列可以用命令rev(sort(x))
rank(x)返回x中元素的秩
log(x, base)计算以base为底的x的对数值
scale(x)如 果x是 一 个 矩 阵 ， 则 中 心 化 和 标 准 化 数 据 ； 若 只 进 行 中 心 化 则使用选项scale=FALSE，只进行标准化则center=FALSE（缺省值 是center=TRUE, scale=TRUE）
pmin(x,y,…)返回一个向量，它的第i个元素是x[i], y[i], . . . 中最小值
pmax(x,y,…)同上，取最大值
cumsum(x)返回一个向量，它的第i个元素是从x[1]到x[i]的和
cumprod(x)同上，取乘积
cummin(x)同上，取最小值
cummax(x)同上，取最大值
match(x, y)返回一个和x的长度相同的向量，表示x中与y中元素相同的元素在y中 的位置（没有则返回NA）
which(x == a)返回一个包含x符合条件（当比较运算结果为真（TRUE）的下标的向 量，在这个结果向量中数值i说明x[i] == a（这个函数的参数必须是 逻辑型变量）
choose(n, k)计算从n个样本中选取k个的组合数
na.omit(x)忽略有缺失值（NA）的观察数据（如果x是矩阵或数据框则忽略相应的 行）
na.fail(x)如果x包含至少一个NA则返回一个错误消息
unique(x)如果x是一个向量或者数据框，则返回一个类似的对象但是去掉所有重 复的元素（对于重复的元素只取一个）
table(x)返回一个表格，给出x中重复元素的个数列表(尤其对于整数型或者因子 型变量)
table(x, y)x与y的列联表
subset(x, …)返回x中的一个满足特定条件…的子集，该条件通常是进行比较运 算：x$V1 < 10；如果x是数据框，选项select给出要保留的变量（或 者用负号表示去掉）
sample(x, size)从x中无放回抽取size个样本，选项replace = TRUE表示有放回的抽样

                

函数	功能
sum(x)	对x中的元素求和
prod(x)	对x中的元素求连乘积
max(x)	x中元素的最大值
min(x)	x中元素的最小值
which.max(x)	返回x中最大元素的下标
which.min(x)	返回x中最小元素的下标
range(x)	与c(min(x), max(x))作用相同
length(x)	x中元素的数目
mean(x)	x中元素的均值
median(x)	x中元素的中位数
var(x) or cov(x)	x中元素的的方差（用n − 1做分母）；如果x是一个矩阵或者一个数据框，将计算协方差阵
cor(x)	如果x是一个矩阵或者一个数据框则计算相关系数矩阵（如果x是一个向量则结果是1）
var(x, y) or cov(x, y)	x和y的协方差，如果是矩阵或数据框则计算x和y对应列的协方差
cor(x, y)	x和y的线性相关系数，如果是矩阵或者数据框则计算相关系数矩阵。
round(x, n)	将x中的元素四舍五入到小数点后n位
rev(x)	对x中的元素取逆序
sort(x)	将x中的元素按升序排列；要按降序排列可以用命令rev(sort(x))
rank(x)	返回x中元素的秩
log(x, base)	计算以base为底的x的对数值
scale(x)	如果x是一个矩阵，则中心化和标准化数据；若只进行中心化则使用选项scale=FALSE，只进行标准化则center=FALSE（缺省值是center=TRUE, scale=TRUE）
pmin(x,y,…)	返回一个向量，它的第i个元素是x[i], y[i], . . . 中最小值
pmax(x,y,…)	同上，取最大值
cumsum(x)	返回一个向量，它的第i个元素是从x[1]到x[i]的和
cumprod(x)	同上，取乘积
cummin(x)	同上，取最小值
cummax(x)	同上，取最大值
match(x, y)	返回一个和x的长度相同的向量，表示x中与y中元素相同的元素在y中的位置（没有则返回NA）
which(x == a)	返回一个包含x符合条件（当比较运算结果为真（TRUE）的下标的向量，在这个结果向量中数值i说明x[i] == a（这个函数的参数必须是逻辑型变量）
choose(n, k)	计算从n个样本中选取k个的组合数
na.omit(x)	忽略有缺失值（NA）的观察数据（如果x是矩阵或数据框则忽略相应的行）
na.fail(x)	如果x包含至少一个NA则返回一个错误消息
unique(x)	如果x是一个向量或者数据框，则返回一个类似的对象但是去掉所有重复的元素（对于重复的元素只取一个）
table(x)	返回一个表格，给出x中重复元素的个数列表(尤其对于整数型或者因子型变量)
table(x, y)	x与y的列联表
subset(x, …)	返回x中的一个满足特定条件…的子集，该条件通常是进行比较运算：x$V1 < 10；如果x是数据框，选项select给出要保留的变量（或者用负号表示去掉）
sample(x, size)	从x中无放回抽取size个样本，选项replace = TRUE表示有放回的抽样