lua string处理

  LUA中的正则表达式 

Step By Step(Lua字符串库)

--------------------------------------------------------------------------------------------------
【基本函数】


string.gfind(s, pattern)
返回一个迭代器,迭代器每执行一次,返回下一个匹配串;
iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")
print(iter()) <== a=b
print(iter()) <== c=d
通常用于泛性for循环,下面的例子结果同上
for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do
print(s)
end
函数 描述 示例 结果
len 计算字符串长度 string.len("abcd") 4
rep 返回字符串s的n个拷贝 string.rep("abcd",2) abcdabcd
lower 返回字符串全部字母大写 string.lower("AbcD") abcd
upper 返回字符串全部字母小写 string.upper("AbcD") ABCD
format 返回一个类似printf的格式化字符串 string.format("the value is:%d",4) the value is:4
sub returns substring from index i to j of s string.sub("abcd",2) bcd
string.sub("abcd",-2) cd
string.sub("abcd",2,-2) bc
string.sub("abcd",2,3) bc
find 在字符串中查找
返回首次出现的起始和结束索引
string.find("cdcdcdcd","ab") nil
string.find("cdcdcdcd","cd")2
string.find("cdcdcdcd","cd",7)8
gsub 在字符串中替换
string.gsub(s, pattern, reps)
第1个参数:源字符串
第2个参数:待替换之模式串
第3个参数:替换为reps(参数是table)
将s中所有符合pattern的字串替换为reps,返回结果串+匹配数

string.gsub(s, pattern, func)
第3个参数:自定义函数,对找到的匹配操作,并传出替换值

string.gfind(s, pattern)
返回一个迭代器,迭代器每执行一次,返回下一个匹配串;
iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")
print(iter()) <== a=b
print(iter()) <== c=d
通常用于泛性for循环,下面的例子结果同上
for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do
print(s)
end
string.gsub("abcdabcd","a","z"); zbcdzbcd 2
string.gsub("aaaa","a","z",3); zzza 3
byte 返回字符的整数形式 string.byte("ABCD",4) 68
char 将整型数字转成字符并连接 string.char(97,98,99,100) abcd
--------------------------------------------------------------------------------------------------
【基本模式串】

字符类 描述 示例 结果
. 任意字符 string.find("",".") nil
%s 空白符 string.find("ab cd","%s%s")4
%S 非空白符 string.find("ab cd","%S%S")2
%p 标点字符 string.find("ab,.cd","%p%p")4
%P 非标点字符 string.find("ab,.cd","%P%P")2
%c 控制字符 string.find("abcd\t\n","%c%c")6
%C 非控制字符 string.find("\t\nabcd","%C%C")4
%d 数字 string.find("abcd12","%d%d")6
%D 非数字 string.find("12abcd","%D%D")4
%x 十六进制数字 string.find("efgh","%x%x")2
%X 非十六进制数字 string.find("efgh","%X%X")4
%a 字母 string.find("AB12","%a%a")2
%A 非字母 string.find("AB12","%A%A")4
%l 小写字母 string.find("ABab","%l%l")4
%L 大写字母 string.find("ABab","%L%L")2
%u 大写字母 string.find("ABab","%u%u")2
%U 非大写字母 string.find("ABab","%U%U")4
%w 字母和数字 string.find("a1()","%w%w")2
%W 非字母非数字 string.find("a1()","%W%W")4
--------------------------------------------------------------------------------------------------
【转义字符%
用%进行转义。'%%'代表'%'
字符类 描述 示例 结果
% 转义字符 string.find("abc%..","%%")4
string.find("abc..d","%.%.")5
--------------------------------------------------------------------------------------------------
【用[]创建字符集,"-"为连字符,"^"表示字符集的补集】

字符类 描述 示例 结果
[01] 匹配二进制数 string.find("32123","[01]")3
[AB][CD] 匹配AC、AD、BC、BD string.find("ABCDEF","[AB][CD]")3
[[]] 匹配一对方括号[] string.find("ABC[]D","[[]]")5
[1-3] 匹配数字1-3 string.find("312","[1-3][1-3][1-3]")3
[b-d] 匹配字母b-d string.find("dbc","[b-d][b-d][b-d]")3
[^%s] 匹配任意非空字符 string.find(" ","[^%s]")3
[^%d] 匹配任意非数字字符 string.find("123a","[^%d]")4
[^%a] 匹配任意非字母字符 string.find("abc1","[^%a]")4
--------------------------------------------------------------------------------------------------
【用"()"进行捕获】

字符类 描述 示例 结果
() 捕获字符串 string.find("12ab","(%a%a)")ab
string.find("ab12","(%d%d)")12
--------------------------------------------------------------------------------------------------
【模式修饰符】

修饰符 描述 示例 结果
+ 表示1个或多个,匹配最多个 string.find("aaabbb","(a+b)")aaab
string.find("cccbbb","(a+b)") nil
- 表示0个或多个,匹配最少个 string.find("zzxyyy","(xy-)")x
string.find("zzzyyy","(x-y)")y
* 表示0个或多个,匹配最多个 string.find("mmmnnn","(m*n)")mmmb
string.find("lllnnn","(m*n)")n
? 表示0个或1个 string.find("aaabbb","(a?b)")ab
string.find("cccbbb","(a?b)")b


下面的表列出了Lua支持的所有字符类:

. 任意字符

%s 空白符

%p 标点字符

%c 控制字符

%d 数字

%x 十六进制数字

%z 代表0的字符

%a 字母

%l 小写字母

%u 大写字母

%w 字母和数字

上面字符类的大写形式表示小写所代表的集合的补集。例如,'%A'非字母的字符:

模式串中的特殊字符

( ) . % + - * ? [ ^ $

'%' 用作特殊字符的转义字符

'%.' 匹配点;

'%%' 匹配字符 '%'。

转义字符 '%'不仅可以用来转义特殊字符,还可以用于所有的非字母的字符。当对一个字符有疑问的时候,为安全起见请使用转义字符转义他。

用'[]'创建字符集

'[%w_]' 匹配字母数字和下划线

'[01]' 匹配二进制数字

'[%[%]]'匹配一对方括号

在'[]'中使用连字符'-'

'%d'    表示 '[0-9]';

'%x'    表示 '[0-9a-fA-F]'

'[0-7]' 表示 '[01234567]'

在'[]'开始处使用 '^' 表示其补集:

'[^0-7]' 匹配任何不是八进制数字的字符;

'[^\n]' 匹配任何非换行符户的字符。

'[^%s]' == '%S'

模式修饰符

+ 匹配前一字符1次或多次

* 匹配前一字符0次或多次;最长匹配

- 匹配前一字符0次或多次;最短匹配

? 匹配前一字符0次或1次

^ 匹配字符串开头 

$ 匹配字符串结尾

捕获:用()将要捕获的部分包围起来

pair = "name = Anna"

firstidx, lastidx, key, value = string.find(pair, "(%a+)%s*=%s*(%a+)")

print(key, value) <== name Anna

拷贝捕获(%1-%9)

s = "abc \"it\'s a cat\""

_,_,_,q = string.find(s, "([\"'])(.-)%1"))

print(q) <== it's a cat 如果%d代表第几个捕获的拷贝。

string.gsub(s, pattern, reps)

第1个参数:源字符串

第2个参数:待替换之模式串

第3个参数:替换为reps

将s中所有符合pattern的字串替换为reps,返回结果串+匹配数

print(string.gsub("hello, world", "o", "a"))       <== hella, warld        2

gsub也可以用拷贝捕获技巧

print(string.gsub("hello, world", "(o)", "%1-%1")) <== hello-o, wo-orld    2

print(string.gsub("hello Lua", "(.)(.)", "%2%1")) <== ehll ouLa           4

function trim (s) return (string.gsub(s, "^%s*(.-)%s*$", "%1")) end <== 注意匹配数用括号丢弃

string.gsub(s, pattern, func)

第3个参数:自定义函数,对找到的匹配操作,并传出替换值

s, n = string.gsub("hello world", "l+", function(s) return "xxx" end) 

print(s, n) <== hexxxo worxxxd 2

string.gfind(s, pattern)

返回一个迭代器,迭代器每执行一次,返回下一个匹配串;

iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")

print(iter()) <== a=b

print(iter()) <== c=d

通常用于泛性for循环,下面的例子结果同上

for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do

print(s)

end




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值