stringr提供一系列用于字符串处理的函数。它与stringi包有着微妙的关系,相当于简化版的stringi包。
它名称非常有特点,以str_
为前缀,以方便用户检索到包中的函数。
这里只展示常用函数,其他函数在实际应用中可以即查即用
字符串
字符串用引号包括起来创建,也可以用c()
创建字符串向量。
a <- 'apple'
b <- c('apple','banana')
字符串长度
str_length
函数可以查看字符串的长度。如果是字符串向量,则返回一个长度的向量。
library(stringr)
str_length(a)
[1] 5
str_length(b)
[1] 5 6
字符串拼接
str_c
函数用来拼接两个及以上字符串。
str_c('a','b')
[1] "ab"
#sep函数可以选择连接的符号
str_c('a','b',sep = '|')
[1] "a|b"
#如果是一个字符串与一个字符串向量拼接,则字符串与字符串向量内的元素依次拼接,返回向量
b
[1] "apple" "banana"
str_c('this is',b,sep = ' ')
[1] "this is apple" "this is banana"
如果是字符串向量与字符串向量拼接,则会警告。
c
[1] "a" "b" "c"
b
[1] "apple" "banana"
str_c(b,c)
[1] "applea" "bananab" "applec"
Warning message:...
#collapse参数可以使字符串向量合并为字符串
str_c(b,collapse = '')
[1] "applebanana"
字符串分割
str_split
函数可以用来分割字符串,参数string为要分割的字符串,pattern为分割符号
x <- 'a,b,c,d'
str_split(x,',')
[[1]]
[1] "a" "b" "c" "d"
取字符串子集
str_sub
函数可以截取字符串的一部分。参数start与end可以设定截取范围。
b
[1] "apple" "banana"
str_sub(b,start = 1,end = 2)
[1] "ap" "ba"
大小写转换
str_to_upper
转换为大写,str_to_lower
转换为小写。locale参数可以设置转换规则,默认为英文。
如果是中文的话,需要使用其他相应的包,进行繁体字与简体字的转换。
str_to_lower(b)
[1] "apple" "banana"
str_to_upper(b)
[1] "APPLE" "BANANA"
去除空格
str_trim
函数可以去除字符串首尾部的空格,参数side有三个选项left,right,both控制去除空格的位置,分别对应首部,尾部,全部。
c <- ' abc '
str_trim(c)
[1] "abc"
字符串匹配
str_subset
函数用来匹配字符串,返回为TRUE的字符串。支持正则匹配。
b
[1] "apple" "banana"
str_subset(b,'ba')
[1] "banana"
字符串检测
str_detect
函数用来检测是否包含要匹配的元素,返回TRUE、FALSE布尔值。
b
[1] "apple" "banana"
str_detect(b,'ba')
[1] FALSE TRUE
R
语
言
小
白
速
通
R语言小白速通
R语言小白速通
懂
点
R
语
言
懂点R语言
懂点R语言
欢
迎
分
享
收
藏
关
注
欢迎分享收藏关注
欢迎分享收藏关注