正则表达式
正则表达式由普通字符(例如字母、数字)和元字符(例如^、$、*、+)组成,通过特定的规则和语法来描述字符串的模式
常见的正则表达式元字符包括:
.
:匹配任意单个字符。a.c
可以匹配 "abc"、"axc"、"a#c" 等。^
:匹配输入字符串的开始位置。^hello
可以匹配 "hello world" 中的 "hello"$
:匹配输入字符串的结束位置。world$
可以匹配 "hello world" 中的 "world"*
:匹配前面的元素零次或多次。go*gle
可以匹配 "ggle"、"google"、"gooogle" 等+
:匹配前面的元素一次或多次。go+gle
可以匹配 "google"、"gooogle"、但不能匹配 "ggle"?
:匹配前面的元素零次或一次。colou?r
可以匹配 "color" 和 "colour"\
:转义字符,用于匹配特殊字符。[0-9]\.
可以匹配任何一个数字后面跟着一个点的字符串[]
:字符集,匹配其中的任意一个字符。[aeiou]
可以匹配任何一个元音字母()
:捕获组,用于分组匹配。(ab)+
可以匹配 "ab"、"abab"、"ababab" 等|
:逻辑或,匹配两者之一。apple|orange
可以匹配 "apple" 或 "orange"
相关函数
grep(pattern, x, ignore.case = FALSE, perl = FALSE, value = FALSE,
fixed = FALSE, useBytes = FALSE, invert = FALSE)
gsub(pattern, replacement, x, ignore.case = FALSE, perl = FALSE,
fixed = FALSE, useBytes = FALSE)
sub(pattern, replacement, x, ignore.case = FALSE, perl = FALSE,
fixed = FALSE, useBytes = FALSE)