修饰符?用于匹配一个可选的字符,比如可以使用‘[±]?%d+’来寻找一个可能带有符号的整数,像“-12”,“24”,“+123”等等。
Lua语言中的修饰符只能作用于一个字符模式,无法作用于一组分类。
以补字符^开头的模式表示从目标字符串的开头开始匹配,而以$结尾的模式表示匹配到目标字符串的结尾。^和¥只有在作用于模式的开头和结尾时才具有特殊含义。
模式'%b'匹配成对的字符串,它的写法是'%bxy',其中x作为起始字符,y作为结束字符。
s = "a (enclosed (in) parentheses) line"
print((string.gsub(s, "%b()", ""))) -- > a line
最后模式'%f[char-set]‘代表前置模式。该模式只有在后一个字符位于char-set内而前一个字符不在时匹配一个空字符串。
s = "the anthem is the theme"
print((string.gsub(s, "%f[%w]the%f[%W]", one))) --> one anthem is one theme.
上例中'%f[%w]’会匹配后一个字符时数字和字母而前一个字符不是数字和字母的情况, ‘%f[%W]’则匹配后一个字符不是字母和数字而前一个字符是字母和数字的情况,在字符串中只能匹配完整地“the”字符串。
前置模式中把目标字符串中第一个字符和最后一个字符的位置当成空字符。所以在上例中,第一个"the"在不属于集合[w]的空字符和符合集合'[%w]的t之前匹配了一个前置。
捕获
Lua中的捕获机制可以根据一个模式从目标字符串中抽出与该模式匹配的内容进行后续操作。模式中需要捕获的部分可以放在一对圆括号中来指定进行捕获。对于具有捕获的模式(圆括号中有指定捕获内容),函数string.match会将所有捕获到的值作为单独的结果返回;
pair = "name = Anna"
key, value = string.match(pair, "(%a+)%s = %s*(%a+)")
print(key, value) --> name Anna
在模式中形如'%n'的分类(n是一个数字),表示匹配到的第n个捕获的副本。
s = [[then he said: "it's all right"!]]
q, quotedPart = string.match(s, "([\"'](.-)%1")
print(quotedPart) --> it's all right
print (q) --> "
第一个捕获是引号本身,第二个捕获是引号中的内容。