R语言正则表达式
本文主要说明R语言的正则表达式,主要是一些简单的函数和stringr包常用的方法
正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
一些R自带的正则函数
grep,主要参数为匹配规则,待匹配的字符串,返回向量中匹配成功的字符串的下标
s<-c('1234abc456','123abcdefabc')
#返回下标
grep('abc',s)
[1] 1 2
grepl,主要参数为匹配规则,待匹配的字符串,返回TRUE或者FALSE
#返回FALSE OR TRUE
grepl('def',s)
[1] FALSE TRUE
sub,主要参数为匹配规则,替换的字符串,待匹配的字符串,返回查找的第一个进行替换
s_t<-sub('abc','$$$',s)
[1] "1234$$$456" "123$$$defabc"
gsub,主要参数为匹配规则,替换的字符串,待匹配的字符串,返回查找的所有进行替换
gd_t<-gsub('abc','$$$',s)
[1] "1234$$$456" "123