通过go的regexp包来提取匹配的指定字符串:
- 正则表达式的分组,以括号()表示,每一对括号就是我们匹配到的一个文本,可以把他们(与括号中匹配的内容)提取出来。
- FindStringSubmatch 方法是提取出匹配的字符串,然后通过[]string返回。我们可以看到,第1个匹配到的是这个字符串本身,从第2个开始,才是我们想要的字符串。
注意:匹配的正则需要用括号分组,才能提取出来,如 (.*?)
其中 (.*?) 表示已知字符串前后内容,找中间匹配到的字符串。如:
“好喝的蜜桃乌龙茶,哈哈哈”,根据前半部分“好喝的”和后半部分“,哈哈哈”,提取出中间部分“蜜桃乌龙茶”特例:
如果想匹配英文括号时,需要特别处理,取消转义~如示例:findDestStr()若与正则表达式匹配的字符串不存在,FindStringSubmatch() 会返回空的 []string 数组
package main
import (
"fmt"
"regexp"
)
// 特例:找出中英文"()()"括号中间的字符,例如:华南地区(广州) -> 广州
func findDestStr(src string) string {
compileRegex := regexp.MustCompile("((.*?))") // 中文括号,例如:华南地区(广州) -> 广州
matchArr := compileRegex.FindStringSubmatch(src)
if len(matchArr) == 0 {
compileRegex := regexp.MustCompile("\\((.*?)\\)") // 兼容英文括号并取消括号的转义,例如:华南地区 (广州) -> 广州。
matchArr = compileRegex.FindStringSubmatch(src)
}
// fmt.Println("提取字符串内容:", matchArr[len(matchArr)-1])
if len(matchArr) > 0 {
return matchArr[len(matchArr)-1]
}
return ""
}
func main() {
str := "好喝的蜜桃乌龙茶,哈哈哈"
compileRegex := regexp.MustCompile("好喝的(.*?),哈哈哈") // 正则表达式的分组,以括号()表示,每一对括号就是我们匹配到的一个文本,可以把他们提取出来。
matchArr := compileRegex.FindStringSubmatch(str) // FindStringSubmatch 方法是提取出匹配的字符串,然后通过[]string返回。我们可以看到,第1个匹配到的是这个字符串本身,从第2个开始,才是我们想要的字符串。
if len(matchArr) > 0 {
fmt.Println("提取字符串内容:", matchArr[len(matchArr)-1]) // 输出:蜜桃乌龙茶
}
return
}