Lua 标准库 - 字符串处理(string manipulation)
【IT168 技术文档】字符串库为Lua提供简易的字符串处理操作,所有的字串操作都是以1为基数的(C以0),也可使用负向索引,最后一个索引为-1 ; 所有的函数都存放在string表,并且已建立元表(__index=string表)
所以string.byte(s,i) <=> s:byte(i)
记住:Lua中的字符串是恒定不变的。String.sub函数以及Lua中其他的字符串操作函数都不会改变字符串的值,而是返回一个新的字符串。
1、string.byte(s [, i [, j]])
功能:返回从i到j的字符所对应的数值(字符 到 ASCII值),i默认为1,j默认为i的值
如:s="123456" s:(1,2) => 49 50
--------------------------------------------------------------------------------
2、string.char (···)
功能:返回ASCII值参数对应的字符串
如:string.char(49,50) => 12
--------------------------------------------------------------------------------
3、string.dump(function)
功能:返回指定函数的二进制代码(函数必须是一个Lua函数,并且没有上值)
--------------------------------------------------------------------------------
4、string.find(s, pattern [, init [, plain]])
功能:查找s中首次出现pattern的位置,如果找到则返回首次出现的起始和结束索引否则返回nil
init:为搜索位置的起始索引,默认为1(也可以用负索引法表示)
plain:true 将关闭样式简单匹配模式,变为无格式匹配
--------------------------------------------------------------------------------
5、string.format (formatstring, ···)
功能:格式化字符串formatstring参数与C差不多,在用来对字符串进行格式化的时候,特别是字符串输出,是功能强大的工具。这个函数有两个参数,使用和C语言的printf函数几乎一模一样,你完全可以照C语言的printf来使用这个函数。第一个参数为格式化串:由指示符和控制格式的字符组成。指示符后的控制格式的字符可以为:十进制'd';十六进制'x';八进制'o';浮点数'f';字符串's'。在指示符'%'和控制格式字符之间还可以有其他的选项:用来控制更详细的格式,比如一个浮点数的小数的位数:
其中:*, l, L, n, p, h不被支持
c, d, E, e, f, g, G, i, o, u, X, x:接受数字参数
q, s:接受字符串参数
%q:为自动将对应参数字串中的特殊字符加上\
如:string.format('%q', 'a string with "quotes" and \n new line')等于
"a string with \"quotes\" and \
new line"
注:此函数不能接受字符串中间带\0的字符
--------------------------------------------------------------------------------
6、string.gmatch(s, pattern)
功能:返回一个迭代函数,每次调用此函数,将返回下一个查找到的样式串对应的字符
如: s = "hello world from Lua"
for w in string.gmatch(s, "%a+") do
print(w)
end
为 hello
word
from
Lua
字串到表的赋值
t = {}
s = "from=world, to=Lua"
for k, v in string.gmatch(s, "(%w+)=(%w+)") do
t[k] = v
end
--------------------------------------------------------------------------------
7、string.gsub (s, pattern, repl [, n])
功能:string.gsub的第一个返回值表示他进行替换操作后的字串s
string.gsub的第二个返回值表示他进行替换操作的次数
s:待替换的字串
pattern:查找的字串
repl:要替换的内容(可以为字串,表,函数)
当repl为字符串时:进行对应字串的替换,%0~%9 %0为全匹配 %% 为%
当repl为表时:
当repl为函数时:每次查找到字符都将
-----------------------------------------------------------------------------------------------------------------------------------------------
8、string.len(s)返回字符串s的长度;
9、string.rep(s, n)返回重复n次字符串s的串;
你使用string.rep("a", 2^20)可以创建一个1M bytes的字符串(比如,为了测试需要)
10、string.upper()和string.lower()
string.lower(s)将s中的大写字母转换成小写(string.upper将小写转换成大写)
11、string.sub(s,i,j)
函数截取字符串s的从第i个字符到第j个字符之间的串。Lua中,字符串的第一个字符索引从1开始。你也可以使用负索引,负索引从字符串的结尾向前计数:-1指向最后一个字符,-2指向倒数第二个,以此类推。所以, string.sub(s, 1, j)返回字符串s的长度为j的前缀;string.sub(s, j, -1)返回从第j个字符开始的后缀。如果不提供第3个参数,默认为-1,因此我们将最后一个调用写为string.sub(s, j);string.sub(s, 2, -2)返回去除第一个和最后一个字符后的子串。
13、
13、string.char函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。
14、函数string.format(s, pattern)
15、模式匹配:
. 任意字符
%a 字母
%c 控制字符
%d 数字
%l 小写字母
%p 标点字符
%s 空白符
%u 大写字母
%w 字母和数字
%x 十六进制数字
%z 代表0的字符
例如:s = "Deadline is 30/05/1999, firm"
date = "%d%d/%d%d/%d%d%d%d"
print(string.sub(s, string.find(s, date))) --> 30/05/1999
上面字符类的大写形式表示小写所代表的集合的补集。例如,'%A'非字母的字符:
print(string.gsub("hello, up-down!", "%A", "."))
--> hello..up.down. 4
(数字4不是字符串结果的一部分,他是gsub返回的第二个结果,代表发生替换的次数。
【IT168 技术文档】字符串库为Lua提供简易的字符串处理操作,所有的字串操作都是以1为基数的(C以0),也可使用负向索引,最后一个索引为-1 ; 所有的函数都存放在string表,并且已建立元表(__index=string表)
所以string.byte(s,i) <=> s:byte(i)
记住:Lua中的字符串是恒定不变的。String.sub函数以及Lua中其他的字符串操作函数都不会改变字符串的值,而是返回一个新的字符串。
1、string.byte(s [, i [, j]])
功能:返回从i到j的字符所对应的数值(字符 到 ASCII值),i默认为1,j默认为i的值
如:s="123456" s:(1,2) => 49 50
--------------------------------------------------------------------------------
2、string.char (···)
功能:返回ASCII值参数对应的字符串
如:string.char(49,50) => 12
--------------------------------------------------------------------------------
3、string.dump(function)
功能:返回指定函数的二进制代码(函数必须是一个Lua函数,并且没有上值)
--------------------------------------------------------------------------------
4、string.find(s, pattern [, init [, plain]])
功能:查找s中首次出现pattern的位置,如果找到则返回首次出现的起始和结束索引否则返回nil
init:为搜索位置的起始索引,默认为1(也可以用负索引法表示)
plain:true 将关闭样式简单匹配模式,变为无格式匹配
--------------------------------------------------------------------------------
5、string.format (formatstring, ···)
功能:格式化字符串formatstring参数与C差不多,在用来对字符串进行格式化的时候,特别是字符串输出,是功能强大的工具。这个函数有两个参数,使用和C语言的printf函数几乎一模一样,你完全可以照C语言的printf来使用这个函数。第一个参数为格式化串:由指示符和控制格式的字符组成。指示符后的控制格式的字符可以为:十进制'd';十六进制'x';八进制'o';浮点数'f';字符串's'。在指示符'%'和控制格式字符之间还可以有其他的选项:用来控制更详细的格式,比如一个浮点数的小数的位数:
其中:*, l, L, n, p, h不被支持
c, d, E, e, f, g, G, i, o, u, X, x:接受数字参数
q, s:接受字符串参数
%q:为自动将对应参数字串中的特殊字符加上\
如:string.format('%q', 'a string with "quotes" and \n new line')等于
"a string with \"quotes\" and \
new line"
注:此函数不能接受字符串中间带\0的字符
--------------------------------------------------------------------------------
6、string.gmatch(s, pattern)
功能:返回一个迭代函数,每次调用此函数,将返回下一个查找到的样式串对应的字符
如: s = "hello world from Lua"
for w in string.gmatch(s, "%a+") do
print(w)
end
为 hello
word
from
Lua
字串到表的赋值
t = {}
s = "from=world, to=Lua"
for k, v in string.gmatch(s, "(%w+)=(%w+)") do
t[k] = v
end
--------------------------------------------------------------------------------
7、string.gsub (s, pattern, repl [, n])
功能:string.gsub的第一个返回值表示他进行替换操作后的字串s
string.gsub的第二个返回值表示他进行替换操作的次数
s:待替换的字串
pattern:查找的字串
repl:要替换的内容(可以为字串,表,函数)
当repl为字符串时:进行对应字串的替换,%0~%9 %0为全匹配 %% 为%
当repl为表时:
当repl为函数时:每次查找到字符都将
-----------------------------------------------------------------------------------------------------------------------------------------------
8、string.len(s)返回字符串s的长度;
9、string.rep(s, n)返回重复n次字符串s的串;
你使用string.rep("a", 2^20)可以创建一个1M bytes的字符串(比如,为了测试需要)
10、string.upper()和string.lower()
string.lower(s)将s中的大写字母转换成小写(string.upper将小写转换成大写)
11、string.sub(s,i,j)
函数截取字符串s的从第i个字符到第j个字符之间的串。Lua中,字符串的第一个字符索引从1开始。你也可以使用负索引,负索引从字符串的结尾向前计数:-1指向最后一个字符,-2指向倒数第二个,以此类推。所以, string.sub(s, 1, j)返回字符串s的长度为j的前缀;string.sub(s, j, -1)返回从第j个字符开始的后缀。如果不提供第3个参数,默认为-1,因此我们将最后一个调用写为string.sub(s, j);string.sub(s, 2, -2)返回去除第一个和最后一个字符后的子串。
13、
13、string.char函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。
14、函数string.format(s, pattern)
15、模式匹配:
. 任意字符
%a 字母
%c 控制字符
%d 数字
%l 小写字母
%p 标点字符
%s 空白符
%u 大写字母
%w 字母和数字
%x 十六进制数字
%z 代表0的字符
例如:s = "Deadline is 30/05/1999, firm"
date = "%d%d/%d%d/%d%d%d%d"
print(string.sub(s, string.find(s, date))) --> 30/05/1999
上面字符类的大写形式表示小写所代表的集合的补集。例如,'%A'非字母的字符:
print(string.gsub("hello, up-down!", "%A", "."))
--> hello..up.down. 4
(数字4不是字符串结果的一部分,他是gsub返回的第二个结果,代表发生替换的次数。