正则表达式函数

最新推荐文章于 2022-03-05 07:49:11 发布

Distrlili

最新推荐文章于 2022-03-05 07:49:11 发布

阅读量993

点赞数

分类专栏： R programing 文章标签：正则函数-r

本文链接：https://blog.csdn.net/G090909/article/details/50117471

版权

R programing 专栏收录该内容

34 篇文章 1 订阅

订阅专栏

R中常用的6个正则表达式函数split,grep,regexpr,gregexpr,sub,gsub

1.strsplit()函数可以使用字符串或正则表达式来决定在哪里拆分字符串，将字符串划分为更小的段。
参数一是要拆分的字符串,参数二是用来将字符串分解成多个部分的字符值或正则表达式.该函数将分解后的子段返回的列表中

语法：strsplit(x,split,fixed=F,perl=F,useBytes = F)
应用：
string <- “split the elements of a character vector x into substring
according to the matches to substring split within them”
part1 <- strsplit(string,split=”“)#拆分成单个字母，其中空格也会被单独列出
part2 <- strsplit(string,split=” “)#根据空格拆分成单个单词字符串

2.grep()函数接受一个正则表达式和一个字符串或字符串向量，并返回由正则表达式匹配的字符串元素的索引。如果参数value=TRUE，则它将返回与正则表达式匹配的实际字符串，而不是其索引号。
语法：
grep(pattern,x,ignore.case=FALSE,perl = FALSE,
value=FALSE,fixed = FALSE,useBytes = FALSE,invert=FALSE)

例如，在LifeCycleSavings数据框中存在两个变量,都是以’pop’开头，
可以使用grep()函数找到这两个变量

head(LifeCycleSavings)
grep("^pop",names(LifeCycleSavings))
grep("^pop",names(LifeCycleSavings),value=TRUE)

返回以某个字符开头或某个字符结尾的字符串

s <- c("huamulan","wuzetian","yuer")
grep("n$",s)  #返回以n结尾的字符串的索引
grep("n$",s,value=TRUE)

如果要匹配的正则表达式不区分大小写时,可以使用ignore.case=TRUE

inp <- c("run dog run","work doggedly","PIG AND DOG")
grep("dog",inp,ignore.case = TRUE,value=TRUE)
[1] "run dog run"   "work doggedly" "PIG AND DOG"

3.regexpr()和gregexpr()函数可用于准确指出和提取字符串中与正则表达式相匹配的部分，这两个函数的输出为一个向量和列表,由所发现的正则表达式的起始点组成；

如果没有匹配发生，返回值为-1，此外，match.length属性与起始点向量结合，提供字符匹配的准确信息。
regexpr函数只提供其输入字符串中第一个匹配的有关信息，而gregexpr函数返回所有匹配的信息。

Distrlili

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
正则表达式函数

R中常用的6个正则表达式函数split,grep,regexpr,gregexpr,sub,gsub1.strsplit()函数可以使用字符串或正则表达式来决定在哪里拆分字符串，将字符串划分为更小的段。参数一是要拆分的字符串,参数二是用来将字符串分解成多个部分的字符值或正则表达式.该函数将分解后的子段返回的列表中语法：strsplit(x,split,fixed=F,perl=F,useByte
复制链接

扫一扫