Step By Step(Lua字符串库)
string.gfind(s, pattern)
返回一个迭代器,迭代器每执行一次,返回下一个匹配串;
iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")
print(iter()) <== a=b
print(iter()) <== c=d
通常用于泛性for循环,下面的例子结果同上
for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do
print(s)
end
函数 | 描述 | 示例 | 结果 |
len | 计算字符串长度 | string.len("abcd") | 4 |
rep | 返回字符串s的n个拷贝 | string.rep("abcd",2) | abcdabcd |
lower | 返回字符串全部字母大写 | string.lower("AbcD") | abcd |
upper | 返回字符串全部字母小写 | string.upper("AbcD") | ABCD |
format | 返回一个类似printf的格式化字符串 | string.format("the value is:%d",4) | the value is:4 |
sub | returns substring from index i to j of s | string.sub("abcd",2) | bcd |
string.sub("abcd",-2) | cd | ||
string.sub("abcd",2,-2) | bc | ||
string.sub("abcd",2,3) | bc | ||
find | 在字符串中查找 返回首次出现的起始和结束索引 | string.find("cdcdcdcd","ab") | nil |
string.find("cdcdcdcd","cd") | 1 | ||
string.find("cdcdcdcd","cd",7) | 7 | ||
gsub | 在字符串中替换 string.gsub(s, pattern, reps) 第1个参数:源字符串 第2个参数:待替换之模式串 第3个参数:替换为reps(参数是table) 将s中所有符合pattern的字串替换为reps,返回结果串+匹配数 string.gsub(s, pattern, func) 第3个参数:自定义函数,对找到的匹配操作,并传出替换值 string.gfind(s, pattern) 返回一个迭代器,迭代器每执行一次,返回下一个匹配串; iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]") print(iter()) <== a=b print(iter()) <== c=d 通常用于泛性for循环,下面的例子结果同上 for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do print(s) end | string.gsub("abcdabcd","a","z"); | zbcdzbcd |
string.gsub("aaaa","a","z",3); | zzza | ||
byte | 返回字符的整数形式 | string.byte("ABCD",4) | 68 |
char | 将整型数字转成字符并连接 | string.char(97,98,99,100) | abcd |
字符类 | 描述 | 示例 | 结果 |
. | 任意字符 | string.find("",".") | nil |
%s | 空白符 | string.find("ab | 3 |
%S | 非空白符 | string.find("ab | 1 |
%p | 标点字符 | string.find("ab,.cd","%p%p") | 3 |
%P | 非标点字符 | string.find("ab,.cd","%P%P") | 1 |
%c | 控制字符 | string.find("abcd\t\n","%c%c") | 5 |
%C | 非控制字符 | string.find("\t\nabcd","%C%C") | 3 |
%d | 数字 | string.find("abcd12","%d%d") | 5 |
%D | 非数字 | string.find("12abcd","%D%D") | 3 |
%x | 十六进制数字 | string.find("efgh","%x%x") | 1 |
%X | 非十六进制数字 | string.find("efgh","%X%X") | 3 |
%a | 字母 | string.find("AB12","%a%a") | 1 |
%A | 非字母 | string.find("AB12","%A%A") | 3 |
%l | 小写字母 | string.find("ABab","%l%l") | 3 |
%L | 大写字母 | string.find("ABab","%L%L") | 1 |
%u | 大写字母 | string.find("ABab","%u%u") | 1 |
%U | 非大写字母 | string.find("ABab","%U%U") | 3 |
%w | 字母和数字 | string.find("a1()","%w%w") | 1 |
%W | 非字母非数字 | string.find("a1()","%W%W") | 3 |
字符类 | 描述 | 示例 | 结果 |
% | 转义字符 | string.find("abc%..","%%") | 4 |
string.find("abc..d","%.%.") | 4 |
字符类 | 描述 | 示例 | 结果 |
[01] | 匹配二进制数 | string.find("32123","[01]") | 3 |
[AB][CD] | 匹配AC、AD、BC、BD | string.find("ABCDEF","[AB][CD]") | 2 |
[[]] | 匹配一对方括号[] | string.find("ABC[]D","[[]]") | 4 |
[1-3] | 匹配数字1-3 | string.find("312","[1-3][1-3][1-3]") | 1 |
[b-d] | 匹配字母b-d | string.find("dbc","[b-d][b-d][b-d]") | 1 |
[^%s] | 匹配任意非空字符 | string.find(" | 3 |
[^%d] | 匹配任意非数字字符 | string.find("123a","[^%d]") | 4 |
[^%a] | 匹配任意非字母字符 | string.find("abc1","[^%a]") | 4 |
字符类 | 描述 | 示例 | 结果 |
() | 捕获字符串 | string.find("12ab","(%a%a)") | 3 |
string.find("ab12","(%d%d)") | 3 |
修饰符 | 描述 | 示例 | 结果 |
+ | 表示1个或多个,匹配最多个 | string.find("aaabbb","(a+b)") | 1 |
string.find("cccbbb","(a+b)") | nil | ||
- | 表示0个或多个,匹配最少个 | string.find("zzxyyy","(xy-)") | 3 |
string.find("zzzyyy","(x-y)") | 4 | ||
* | 表示0个或多个,匹配最多个 | string.find("mmmnnn","(m*n)") | 1 |
string.find("lllnnn","(m*n)") | 4 | ||
? | 表示0个或1个 | string.find("aaabbb","(a?b)") | 3 |
string.find("cccbbb","(a?b)") | 4 |
下面的表列出了Lua支持的所有字符类:
. 任意字符
%s 空白符
%p 标点字符
%c 控制字符
%d 数字
%x 十六进制数字
%z 代表0的字符
%a 字母
%l 小写字母
%u 大写字母
%w 字母和数字
上面字符类的大写形式表示小写所代表的集合的补集。例如,'%A'非字母的字符:
模式串中的特殊字符
( ) . % + - * ? [ ^ $
'%' 用作特殊字符的转义字符
'%.' 匹配点;
'%%' 匹配字符 '%'。
转义字符 '%'不仅可以用来转义特殊字符,还可以用于所有的非字母的字符。当对一个字符有疑问的时候,为安全起见请使用转义字符转义他。
用'[]'创建字符集
'[%w_]' 匹配字母数字和下划线
'[01]' 匹配二进制数字
'[%[%]]'匹配一对方括号
在'[]'中使用连字符'-'
'%d' 表示 '[0-9]';
'%x' 表示 '[0-9a-fA-F]'
'[0-7]' 表示 '[01234567]'
在'[]'开始处使用 '^' 表示其补集:
'[^0-7]' 匹配任何不是八进制数字的字符;
'[^\n]' 匹配任何非换行符户的字符。
'[^%s]' == '%S'
模式修饰符
+ 匹配前一字符1次或多次
* 匹配前一字符0次或多次;最长匹配
- 匹配前一字符0次或多次;最短匹配
? 匹配前一字符0次或1次
^ 匹配字符串开头
$ 匹配字符串结尾
捕获:用()将要捕获的部分包围起来
pair = "name = Anna"
firstidx, lastidx, key, value = string.find(pair, "(%a+)%s*=%s*(%a+)")
print(key, value) <== name Anna
拷贝捕获(%1-%9)
s = "abc \"it\'s a cat\""
_,_,_,q = string.find(s, "([\"'])(.-)%1"))
print(q) <== it's a cat 如果%d代表第几个捕获的拷贝。
string.gsub(s, pattern, reps)
第1个参数:源字符串
第2个参数:待替换之模式串
第3个参数:替换为reps
将s中所有符合pattern的字串替换为reps,返回结果串+匹配数
print(string.gsub("hello, world", "o", "a")) <== hella, warld 2
gsub也可以用拷贝捕获技巧
print(string.gsub("hello, world", "(o)", "%1-%1")) <== hello-o, wo-orld 2
print(string.gsub("hello Lua", "(.)(.)", "%2%1")) <== ehll ouLa 4
function trim (s) return (string.gsub(s, "^%s*(.-)%s*$", "%1")) end <== 注意匹配数用括号丢弃
string.gsub(s, pattern, func)
第3个参数:自定义函数,对找到的匹配操作,并传出替换值
s, n = string.gsub("hello world", "l+", function(s) return "xxx" end)
print(s, n) <== hexxxo worxxxd 2
string.gfind(s, pattern)
返回一个迭代器,迭代器每执行一次,返回下一个匹配串;
iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")
print(iter()) <== a=b
print(iter()) <== c=d
通常用于泛性for循环,下面的例子结果同上
for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do
print(s)
end