LUA字符串匹配操作

最新推荐文章于 2023-11-21 17:06:44 发布

hqzxsc2006

最新推荐文章于 2023-11-21 17:06:44 发布

阅读量1.9k

点赞数

分类专栏： Lua 文章标签： lua 格式化匹配字符串操作

本文链接：https://blog.csdn.net/hqzxsc2006/article/details/20121939

版权

Lua 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1、string.byte(s [, i [, j]])

功能：返回从i到j的字符所对应的数值(字符到 ASCII值),i默认为1,j默认为i的值

如：s="123456" s:(1,2) => 49 50

--------------------------------------------------------------------------------

2、string.char (···)

功能：返回ASCII值参数对应的字符串

如：string.char(49,50) => 12

--------------------------------------------------------------------------------

3、string.dump(function)

功能：返回指定函数的二进制代码(函数必须是一个Lua函数，并且没有上值)

--------------------------------------------------------------------------------

4、string.find(s, pattern [, init [, plain]])

功能：查找s中首次出现pattern的位置,如果找到则返回首次出现的起始和结束索引否则返回nil

init:为搜索位置的起始索引，默认为1(也可以用负索引法表示)

plain:true 将关闭样式简单匹配模式,变为无格式匹配

如s=E:\Practice\test\test\test.cpp

_,_,p=string.find(s,'.+[\\](.+.cpp)')

_表示哑元变量，返回的p为次路径的文件名

--------------------------------------------------------------------------------

5、string.format (formatstring, ···)

功能：格式化字符串formatstring参数与C差不多，在用来对字符串进行格式化的时候，特别是字符串输出，是功能强大的工具。这个函数有两个参数，使用和C语言的printf函数几乎一模一样，你完全可以照C语言的printf来使用这个函数。第一个参数为格式化串：由指示符和控制格式的字符组成。指示符后的控制格式的字符可以为：十进制'd'；十六进制'x'；八进制'o'；浮点数'f'；字符串's'。在指示符'%'和控制格式字符之间还可以有其他的选项：用来控制更详细的格式，比如一个浮点数的小数的位数：

其中：*, l, L, n, p, h不被支持

c, d, E, e, f, g, G, i, o, u, X, x：接受数字参数

q, s：接受字符串参数

%q：为自动将对应参数字串中的特殊字符加上\

如：string.format('%q', 'a string with "quotes" and \n new line')等于

"a string with \"quotes\" and \

new line"

注：此函数不能接受字符串中间带\0的字符

--------------------------------------------------------------------------------

6、string.gmatch(s, pattern)

功能：返回一个迭代函数，每次调用此函数，将返回下一个查找到的样式串对应的字符

如： s = "hello world from Lua"

for w in string.gmatch(s, "%a+") do

print(w)

end

为 hello

word

from

Lua

字串到表的赋值

t = {}

s = "from=world, to=Lua"

for k, v in string.gmatch(s, "(%w+)=(%w+)") do

t[k] = v

end

--------------------------------------------------------------------------------

7、string.gsub (s, pattern, repl [, n])

功能：string.gsub的第一个返回值表示他进行替换操作后的字串s

string.gsub的第二个返回值表示他进行替换操作的次数　　

s:待替换的字串

pattern:查找的字串

repl:要替换的内容(可以为字串，表，函数)

当repl为字符串时：进行对应字串的替换，%0~%9 %0为全匹配 %% 为%

当repl为表时：

当repl为函数时：每次查找到字符都将

------------------------------------------------------------------------------

8、string.len(s)返回字符串s的长度；

------------------------------------------------------------------------------

9、string.rep(s, n)返回重复n次字符串s的串；

你使用string.rep("a", 2^20)可以创建一个1M bytes的字符串（比如，为了测试需要）

10、string.upper（）和string.lower（）

string.lower(s)将s中的大写字母转换成小写（string.upper将小写转换成大写）

------------------------------------------------------------------------------

11、string.sub(s,i,j)返回剪切的字符串

函数截取字符串s的从第i个字符到第j个字符之间的串。Lua中，字符串的第一个字符索引从1开始。你也可以使用负索引，负索引从字符串的结尾向前计数：-1指向最后一个字符，-2指向倒数第二个，以此类推。所以， string.sub(s, 1, j)返回字符串s的长度为j的前缀；string.sub(s, j, -1)返回从第j个字符开始的后缀。如果不提供第3个参数，默认为-1，因此我们将最后一个调用写为string.sub(s, j)；string.sub(s, 2, -2)返回去除第一个和最后一个字符后的子串。

------------------------------------------------------------------------------

12、string.char函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数，将每一个数字转换成字符，然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)将字符串s的第i个字符的转换成整数；第二个参数是可选的，缺省情况下i=1。
------------------------------------------------------------------------------

13、

string.gfind(s, pattern)

返回一个迭代器，迭代器每执行一次，返回下一个匹配串；

iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")

print(iter()) <== a=b

print(iter()) <== c=d

通常用于泛性for循环,下面的例子结果同上

for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do

print(s)

end

14、模式匹配：

. 任意字符

%a 字母

%c 控制字符

%d 数字

%l 小写字母

%p 标点字符

%s 空白符

%u 大写字母

%w 字母和数字

%x 十六进制数字

%z 代表0的字符

例如：s = "Deadline is 30/05/1999, firm"

date = "%d%d/%d%d/%d%d%d%d"

print(string.sub(s, string.find(s, date))) --> 30/05/1999

上面字符类的大写形式表示小写所代表的集合的补集。例如，'%A'非字母的字符：

print(string.gsub("hello, up-down!", "%A", "."))

--> hello..up.down. 4

（数字4不是字符串结果的一部分，他是gsub返回的第二个结果，代表发生替换的次数。）

特殊字符如下：
(). % + - * ? [ ^ $
% 也作为以上特殊字符的转义字符。

[] 该方框作为匹配该范围的集合，。
如[0-9] 则匹配0到9的数字范围

Lua 中的模式修饰符有四个：
+   匹配前一字符 1 次或多次，最长匹配
*   匹配前一字符 0 次或多次，最长匹配
-   匹配前一字符 0 次或多次，最短匹配
?   匹配前一字符 0 次或 1次
'+'，匹配一个或多个字符，总是进行最长的匹配。
如，模式 '%a+' 匹配一个或多个字母或者一个单词：

注意以上的区别：

如：匹配c中的注释串
用 '/%*.*%*/' 和'/%*.-%*/'

str = "int x; /* x */ int y; /* y */"
print(string.gsub(str, "/%*.*%*/", "<注释串>"))
--> int x; <注释串>
采用 '.-' 则为最短匹配，即匹配 "/*" 开始到第一个 "*/" 之前的部分：
str = "int x; /* x */ int y; /* y */"
print(string.gsub(str, "/%*.-%*/", "<注释部分>"))
--> int x; <注释串> int y; <注释串>

以 '^' 开头表示只匹配目标串的开始部分，
以 '$' 结尾表示只匹配目标串的结尾部分。

%b 表示匹配对称字符，注意其只能针对的ansi码单字符。
x = string.gsub("xdddddyxxx", "%bxy", "取代")
print(x)   -->取代xxx

如去除字符串首尾的空格：
function trim (s)
return (string.gsub(s, "^%s*(.-)%s*$", "%1"))
end

hqzxsc2006

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LUA字符串匹配操作

1、string.byte(s [, i [, j]])　　功能：返回从i到j的字符所对应的数值(字符到 ASCII值),i默认为1,j默认为i的值　　如：s="123456" s:(1,2) => 49 50　　--------------------------------------------------------------------------------
复制链接

扫一扫