用stringr包进行字符串处理


stringr提供一系列用于字符串处理的函数。它与stringi包有着微妙的关系,相当于简化版的stringi包。

它名称非常有特点,以str_为前缀,以方便用户检索到包中的函数。

这里只展示常用函数,其他函数在实际应用中可以即查即用

字符串

字符串用引号包括起来创建,也可以用c()创建字符串向量。

a <- 'apple'
b <- c('apple','banana')

字符串长度

str_length函数可以查看字符串的长度。如果是字符串向量,则返回一个长度的向量。

library(stringr)
str_length(a)
[1] 5
str_length(b)
[1] 5 6

字符串拼接

str_c函数用来拼接两个及以上字符串。

str_c('a','b')
[1] "ab"
#sep函数可以选择连接的符号
str_c('a','b',sep = '|')
[1] "a|b"
#如果是一个字符串与一个字符串向量拼接,则字符串与字符串向量内的元素依次拼接,返回向量
b
[1] "apple"  "banana"
str_c('this is',b,sep = ' ')
[1] "this is apple"  "this is banana"
如果是字符串向量与字符串向量拼接,则会警告。
c
[1] "a" "b" "c"
b
[1] "apple"  "banana"
str_c(b,c)
[1] "applea"  "bananab" "applec" 
Warning message:...
#collapse参数可以使字符串向量合并为字符串
  str_c(b,collapse = '')
[1] "applebanana"

字符串分割

str_split函数可以用来分割字符串,参数string为要分割的字符串,pattern为分割符号

x <- 'a,b,c,d'
str_split(x,',')
[[1]]
[1] "a" "b" "c" "d"

取字符串子集

str_sub函数可以截取字符串的一部分。参数start与end可以设定截取范围。

b
[1] "apple"  "banana"
str_sub(b,start = 1,end = 2)
[1] "ap" "ba"

大小写转换

str_to_upper转换为大写,str_to_lower转换为小写。locale参数可以设置转换规则,默认为英文。

如果是中文的话,需要使用其他相应的包,进行繁体字与简体字的转换。

str_to_lower(b)
[1] "apple"  "banana"
str_to_upper(b)
[1] "APPLE"  "BANANA"

去除空格

str_trim函数可以去除字符串首尾部的空格,参数side有三个选项left,right,both控制去除空格的位置,分别对应首部,尾部,全部。

c <- ' abc   '
str_trim(c)
[1] "abc"

字符串匹配

str_subset函数用来匹配字符串,返回为TRUE的字符串。支持正则匹配。

b
[1] "apple"  "banana"
str_subset(b,'ba')
[1] "banana"

字符串检测

str_detect函数用来检测是否包含要匹配的元素,返回TRUE、FALSE布尔值。

b
[1] "apple"  "banana"
str_detect(b,'ba')
[1] FALSE  TRUE

gzh.png

R 语 言 小 白 速 通 R语言小白速通 R
懂 点 R 语 言 懂点R语言 R
欢 迎 分 享 收 藏 关 注 欢迎分享收藏关注

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值