lua字符串

目录

 

lua字符串

字符串操作

字符串大小写转换

字符串查找与反转

字符串格式化

字符串与整数相互转换

其他常用函数

模式匹配


lua字符串


字符串是由数字、字母、下划线组成的一串字符串

lua语言中字符串可以使用一下三种方式来表示:

  • 单引号的一串字符
  • 双引号的一串字符
  • [[]]间的一串字符
string1 = "lua"
print("\"字符串 1 是\"",string1)

string2 = 'www.baidu.com' 
print("字符串 2 是",string2)

string3 = [["lua 教程"]]
print("字符串 3 是",string3)
root@mzs:/home/mzs/lua_study/lua_mzs/hello# lua lua_string.lua 
"字符串 1 是"	lua
字符串 2 是	www.baidu.com
字符串 3 是	"lua 教程"

转义字符用于表示不能直接显示的字符,比如后退键,回车键。

字符串操作


lua提供了很多的方法来支持字符串操作

序号方法和用途
1string.upper(argument)  字符串全部转换为大写字母
2string.lower(argument) 字符串全部转换为小写字母
3

string.gsub(mainString,findString,replaceString,num)

在字符串中替换,mainString为要替换的字符串,findString为被替换的字符串,replaceString为被替换后的字符串,

num替换次数(可以忽略,代表全部替换) 如:

> string.gsub("aaaa","a","z",3)

zzza    3
>

4

string.find(str,substr,[init,[end]])

在一个指定的目标字符串中搜索指定的内容(第三个参数为索引),返回其具体位置,不存在则返回nil

> string.find("Hello Lua user", "Lua", 1)
7    9

>

5

string.reverse(arg)

字符串反转

> string.reverse("abcd")
dcba
>

6

string.format(...)

返回一个类似printf的格式化字符串

> string.format("the value is : %d", 4)
the value is : 4
>

 

7

string.char(arg) 和 string.byte(arg[,int])

char 将整形数转换成字符并连接,byte转换字符为整数值(可以指定某个字符,默认第一个字符)

> string.char(97,98,99,100)
abcd
> string.byte("adcd",4)
100
> string.byte("abcd")
97
>

8

string.len(arg)

计算字符串的长度

> string.len("abcd")
4
>

9

string.rep(string,n)

返回字符串string的n个拷贝

> string.rep("abcd",3)
abcdabcdabcd
>

10

..

连接两个字符串

> print("aaaa".."bbbb")
aaaabbbb
>

 

11

string.gmatch(str,pattern)

反回一个迭代器函数,每一次调用这个函数,返回一个在字符串str找到的下一个符合pattern描述的字串。

如果参数pattern描述的字符串没有找到,迭代函数返回Nil

> for word in string.gmatch("Hello Lua user", "%a+") do print(word) end
Hello
Lua
user
12

string.match(str,pattern,init)

string.match()只寻找源字符串str中的第一个配对。参数init可指定搜寻过程的起点,默认为1

在匹配成功时,函数将返回配对表达式中的所有捕获结果。

当没有匹配成功是,返回Nil

如果没有设置捕获标记,则返回整个配对字符串。

> = string.match("I have 2 questions for you.", "%d+ %a+")
2 questions

> = string.format("%d, %q", string.match("I have 2 questions for you.", "(%d+) (%a+)"))
2, "questions"

字符串大小写转换


> string = "Lua"
> print(string.upper(string))
LUA
> print(string.lower(string))
lua
> 

字符串查找与反转


> string = "Lua Tutorial"
> print(string.find(string,"Tutorial"))
5	12
> print(string.reverse(string))
lairotuT auL
> 

字符串格式化


Lua 提供了string.format()函数来生成具有特定格式的字符串。

函数第一个参数是格式,之后对应格式中的每个代号的数据。

格式字符串可能包含以下的转义码:

  • %c - 接受一个数字, 并将其转化为ASCII码表中对应的字符
  • %d, %i - 接受一个数字并将其转化为有符号的整数格式
  • %o - 接受一个数字并将其转化为八进制数格式
  • %u - 接受一个数字并将其转化为无符号整数格式
  • %x - 接受一个数字并将其转化为十六进制数格式, 使用小写字母
  • %X - 接受一个数字并将其转化为十六进制数格式, 使用大写字母
  • %e - 接受一个数字并将其转化为科学记数法格式, 使用小写字母e
  • %E - 接受一个数字并将其转化为科学记数法格式, 使用大写字母E
  • %f - 接受一个数字并将其转化为浮点数格式
  • %g(%G) - 接受一个数字并将其转化为%e(%E, 对应%G)及%f中较短的一种格式
  • %q - 接受一个字符串并将其转化为可安全被Lua编译器读入的格式
  • %s - 接受一个字符串并按照给定的参数格式化该字符串

为进一步细化格式, 可以在%号后添加参数. 参数将以如下的顺序读入:

  • (1) 符号: 一个+号表示其后的数字转义符将让正数显示正号. 默认情况下只有负数显示符号.
  • (2) 占位符: 一个0, 在后面指定了字串宽度时占位用. 不填时的默认占位符是空格.
  • (3) 对齐标识: 在指定了字串宽度时, 默认为右对齐, 增加-号可以改为左对齐.
  • (4) 宽度数值
  • (5) 小数位数/字串裁切: 在宽度数值后增加的小数部分n, 若后接f(浮点数转义符, 如%6.3f)则设定该浮点数的小数只保留n位, 若后接s(字符串转义符, 如%5.3s)则设定该字符串只显示前n位.
string1 = "Lua"
string2 = "Tutorial"
number1 = 10 
number2 = 20

--基本字符串格式化
print(string.format("基本格式化 %s %s",string1,string2))
--日期格式化
date = 2 
month = 1
year = 2018
print(string.format("日期格式化 %02d%02d%02d",date,month,year))
--十进制格式化
print(string.format("%.4f",1/3))
root@mzs:/home/mzs/lua_study/lua_mzs/hello# lua string_format.lua 
基本格式化 Lua Tutorial
日期格式化 02012018
0.3333

其他例子:

 

string.format("%c", 83)            输出S
string.format("%+d", 17.0)              输出+17
string.format("%05d", 17)               输出00017
string.format("%o", 17)                 输出21
string.format("%u", 3.14)               输出3
string.format("%x", 13)                 输出d
string.format("%X", 13)                 输出D
string.format("%e", 1000)               输出1.000000e+03
string.format("%E", 1000)               输出1.000000E+03
string.format("%6.3f", 13)              输出13.000
string.format("%q", "One\nTwo")         输出"One\
                                          Two"
string.format("%s", "monkey")           输出monkey
string.format("%10s", "monkey")         输出    monkey
string.format("%5.3s", "monkey")        输出  mon

字符串与整数相互转换


--字符转换
--转换第一个字符
print(string.byte("Lua"))
--转换第三个字符
print(string.byte("Lua",3))
--转换末尾第一个字符
print(string.byte("Lua",-1))
--转换第二个字符
print(string.byte("Lua",2))
--转换末尾第二个字符
print(string.byte("Lua",-2))

--整数ASCII码转换为字符
print(string.char(97))
root@mzs:/home/mzs/lua_study/lua_mzs/hello# lua string_byte.lua 
76
97
97
117
117
a

其他常用函数


计算字符串长度、字符串连接、字符串复制

string1 = "www."
string2 = "baidu"
string3 = ".com"

--使用..进行字符串连接
print("连接字符串",string1..string2..string3)

--字符串长度
print("字符串长度",string.len(string2))

--字符串复制2次
repeatedString = string.rep(string2,2)
print(repeatedString)
root@mzs:/home/mzs/lua_study/lua_mzs/hello# lua string_other.lua 
连接字符串	www.baidu.com
字符串长度	5
baidubaidu

模式匹配


lua中的匹配模式直接用常规的字符串来描述。

它用于模式匹配函数

string.find

string.gmatch

string.gsub

string.match

你还可以在模式串中使用字符类。

字符类指可以匹配一个特定字符集合内任何字符的模式项。比如字符类%d匹配任意数字。

所以你可以使用模式串'%d%d/%d%d/%d%d%d%d' 搜索dd/mm/yyyy格式的日期。

> s = "deadline is 30/05/19991,firm"
> date = "%d%d/%d%d/%d%d%d%d"
> print(string.sub(s,string.find(s,date)))
30/05/1999
> 

下面的表列出了Lua支持的所有字符类:

单个字符(除 ^$()%.[]*+-? 外): 与该字符自身配对

  • .(点): 与任何字符配对
  • %a: 与任何字母配对
  • %c: 与任何控制符配对(例如\n)
  • %d: 与任何数字配对
  • %l: 与任何小写字母配对
  • %p: 与任何标点(punctuation)配对
  • %s: 与空白字符配对
  • %u: 与任何大写字母配对
  • %w: 与任何字母/数字配对
  • %x: 与任何十六进制数配对
  • %z: 与任何代表0的字符配对
  • %x(此处x是非字母非数字字符): 与字符x配对. 主要用来处理表达式中有功能的字符(^$()%.[]*+-?)的配对问题, 例如%%与%配对
  • [数个字符类]: 与任何[]中包含的字符类配对. 例如[%w_]与任何字母/数字, 或下划线符号(_)配对
  • [^数个字符类]: 与任何不包含在[]中的字符类配对. 例如[^%s]与任何非空白字符配对

当上述的字符类用大写书写时, 表示与非此字符类的任何字符配对. 例如, %S表示与任何非空白字符配对.例如,'%A'非字母的字符:

> print(string.gsub("hello, up-down!","%A","."))
hello..up.down.	4
> 

数字4不是字符串结果的一部分,他是gsub返回的第二个结果,代表发生替换的次数。

在模式匹配中有一些特殊字符,他们有特殊意义,lua中的特殊字符如下:

( ) . % + - * ? [ ^ $

‘%’ 用作特殊字符的转移字符,一次‘%.’ 匹配点;“%%匹配字符‘%’ 。转义字符 '%'不仅可以用来转义特殊字符,还可以用于所有的非字母的字符

模式条目可以是:

  • 单个字符类匹配该类别中任意单个字符;
  • 单个字符类跟一个 '*', 将匹配零或多个该类的字符。 这个条目总是匹配尽可能长的串;
  • 单个字符类跟一个 '+', 将匹配一或更多个该类的字符。 这个条目总是匹配尽可能长的串;
  • 单个字符类跟一个 '-', 将匹配零或更多个该类的字符。 和 '*' 不同, 这个条目总是匹配尽可能短的串;
  • 单个字符类跟一个 '?', 将匹配零或一个该类的字符。 只要有可能,它会匹配一个;
  • %n, 这里的 n 可以从 1 到 9; 这个条目匹配一个等于 n 号捕获物(后面有描述)的子串。
  • %bxy, 这里的 xy 是两个明确的字符; 这个条目匹配以 x 开始 y 结束, 且其中 xy 保持 平衡 的字符串。 意思是,如果从左到右读这个字符串,对每次读到一个 x+1 ,读到一个 y-1, 最终结束处的那个 y 是第一个记数到 0 的 y。 举个例子,条目 %b() 可以匹配到括号平衡的表达式。
  • %f[set], 指 边境模式; 这个条目会匹配到一个位于 set 内某个字符之前的一个空串, 且这个位置的前一个字符不属于 set 。 集合 set 的含义如前面所述。 匹配出的那个空串之开始和结束点的计算就看成该处有个字符 '\0' 一样。

模式:

模式 指一个模式条目的序列。 在模式最前面加上符号 '^' 将锚定从字符串的开始处做匹配。 在模式最后面加上符号 '$' 将使匹配过程锚定到字符串的结尾。 如果 '^' 和 '$' 出现在其它位置,它们均没有特殊含义,只表示自身。

捕获:

模式可以在内部用小括号括起一个子模式; 这些子模式被称为 捕获物。 当匹配成功时,由 捕获物 匹配到的字符串中的子串被保存起来用于未来的用途。 捕获物以它们左括号的次序来编号。 例如,对于模式 "(a*(.)%w(%s*))" , 字符串中匹配到 "a*(.)%w(%s*)" 的部分保存在第一个捕获物中 (因此是编号 1 ); 由 "." 匹配到的字符是 2 号捕获物, 匹配到 "%s*" 的那部分是 3 号。

作为一个特例,空的捕获 () 将捕获到当前字符串的位置(它是一个数字)。 例如,如果将模式 "()aa()" 作用到字符串 "flaaap" 上,将产生两个捕获物: 3 和 5 。

 

 

 

 

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值