R语言之数值与字符处理函数

      函数是R语言中处理数据的基石,大致可以分为数值处理函数与字符处理函数两大类,数值处理函数又可以分为数学函数、统计函数、概率函数。本节归纳了R语言函数及其用法。

1.数值函数

1.1.数学函数

函 数
描 述
abs(x)求x的绝对值
例如abs(-8),则返回的值为8
sqrt(x)求x的平方根
l例如sqrt(16),返回值为4,等价于16^(0.5)
ceiling(x)向上取整,不小于x的整数
例如ceiling(1.23),返回值为2
floor(x)向下取整,不大于x的整数
例如floor(1.23),返回值为1
trunc(x)向0的方向取整
trunc(3.69)返回值为3,trunc(-3.69)返回值为-3
round(x,digits=n)将x舍为指定位数
round(1.2346,3)返回值为1.235
signif(x,digits=n)将x舍入为指定有效位数
signif(1.2346,3)返回值为1.23
sin(x)、cos(x)、tan(x)正弦、余弦、正切函数
asin(x)、acos(x)、atan(x)反正弦、反余弦、反正切函数
sinh(x)、cosh(x)、tanh(x)双曲正弦、双曲余弦、双曲正切函数
log(x,base=n)求x以n为底的对数
log(x)求x的自然对数
exp(x)以自然常数e为底的指数函数

这些函数可以应用到标量(单独的数值)上,也可以应用于数值向量、矩阵、数据框中,此时会作用于没一个独立的数值上。

> sqrt(16)
[1] 4
> sqrt(c(1,4,9,16,25))
[1] 1 2 3 4 5
> data<-matrix(c(1,4,9,16),2,2)
> data
     [,1] [,2]
[1,]    1    9
[2,]    4   16
> sqrt(data)
     [,1] [,2]
[1,]    1    3
[2,]    2    4

1.2.统计函数

函 数
描 述
mean(x)均值
mean(c(1,2,3,4,5))返回值为3
median(x)中位数
median(c(1,2,3,4,5)返回值为3
median(c(1,2,3,4))返回值为2.5
sd(x)标准差
sd(c(1,2,3,4,5))返回值为1.581139
var(x)方差
var(c(1,2,3,4,5))返回值为2.5
mad(x)绝对中位差
mad(c(1,2,3,4,5))返回值为1.4826
quantile(x,probs)求分位数,其中 x 为待求分位数的数值型向量,probs 为一个由[0,1]之间的概率值组成的数值向量
range(x)求值域
x<-(1,2,3,4,5),range(x)返回值为c(1,5)
sum(x)求和
sum(c(1,2,3,4,5))返回值为15
max(x)求最大值
max(c(1,2,3,4,5))返回值为5
min(x)求最小值
min(c(1,2,3,4,5))返回值为1
diff(x,lag=n)求滞后差分,lag为滞后阶数,默认为1
scale(x,center=TRUE,scale=TRUE)为数据对象x按列进行中心化(center=TRUE)或者标准化(center=TRUE,scale=TRUE)

1.3.概率函数

函数缩写名称函数缩写名称
beta贝塔分布logis逻辑分布
binom二项分布multinom多项分布
cauchy柯西分布nbinom负二项分布
chisq非中心卡方分布norm正态分布
exp指数分布pois泊松分布
fF分布signrankWilcoxon符号秩分布
gamma伽马分布tt分布
gemo几何分布unif均匀分布
hyper超几何分布weibullWeibull分布
lonrm对数正态分布wilcoxWilcoxon

2.字符函数

函 数
描 述
nchar(x)计算x中字符数量
substr(x,start,stop)提取或替换一个向量中的子串
grep(pattern,x,ignore.case=FALSE,fixed=FALSE)在 x 中搜索某种模式。若 fixed=FALSE,则 pattern 为一个正则表达式。若fixed=TRUE,则 pattern 为一个文本字符串。返回值为匹配的下标 grep(“A”,c(“b”,“A”,“c”),fixed=TRUE)返回值为 2
sub(pattern, replacement, x, ignore.case=FALSE, fixed=FALSE)在 x 中搜索 pattern,并以文本 replacement 将其替换。若 fixed=FALSE,则pattern 为一个正则表达式。若 fixed=TRUE,则 pattern 为一个文本字符串。 sub("\s",".",“Hello There”)返回值为 Hello.There。注意,"\s"是一个用来查找空白的正则表达式;使用"\s"而不用""的原因是,后者是 R中的转义字符
strsplit(x, split, fixed=FALSE)在 split 处分割字符向量 x 中的元素。若 fixed=FALSE,则 pattern 为一个正则表达式。若 fixed=TRUE,则 pattern 为一个文本字符串 y <- strsplit(“abc”, “”)将返回一个含有 1个成分、3个元素的列表,包含的内容为"a" “b” “c” unlist(y)[2]和 sapply(y, “[”, 2)均会返回"b"
paste(…, sep="")连接字符串,分隔符为 sep paste(“x”, 1:3,sep="")返回值为 c(“x1”, “x2”, “x3”)
paste(“x”,1:3,sep=“M”)返回值为 c(“xM1”,“xM2” “xM3”)
paste(“Today is”, date())返回值为 Today is Thu Jun 25 14:17:32 2011
toupper(x)大写转换 toupper(“abc”)返回值为"ABC"
tolower(x)小写转换 tolower(“ABC”)返回值为"abc"

3.其他函数

函 数
描 述
length(x)求对象 x 的长度 ,x <- c(2, 5, 6, 9) ,length(x)返回值为 4
seq(from, to, by)生成一个序列 ,indices <- seq(1,10,2) ,indices 的值为 c(1, 3, 5, 7, 9)
rep(x, n)将 x 重复 n 次 ,y <- rep(1:3, 2) ,y 的值为 c(1, 2, 3, 1, 2, 3)
cut(x, n)将连续型变量 x 分割为有着 n 个水平的因子,使用选项 ordered_result = TRUE 以创建一个有序型因子
pretty(x, n)创建美观的分割点。通过选取 n+1 个等间距的取整值,将一个连续型变量 x分割为 n 个区间。
cat(… , file =“myfile”, append =FALSE)连接…中的对象,并将其输出到屏幕上或文件中(如果声明了一个的话) firstname <- c(“Jane”) cat(“Hello” ,firstname, “\n”)

特别注明本文属于R语言学习笔记,不以盈利为目的,纯手工码字不容易,若整理的笔记中,对您有所助益,麻烦点个赞或者收藏,万分感谢!如有构成侵权的地方,请联系作者删除,谢谢合作!

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值