Lua程序设计(四)

字符串是用于表示文本的手段。Lua语言提供的字符串是由一串字节组成的序列。每个字符用8个比特位来存储。虽然Lua支持用任意一种方法来存储Unicode字符串,但是最好在一切可能的情况下优先使用UTF-8编码。、

需要注意的是Lua中的字符串是不可变值,不能直接修改字符串中的某个字符,仅能通过创建一个新的字符串来达到目的。

a = "one string"
b = string.gsub(a, "one", "another")
print(a)   --> one string 
print(b)   --> another string

字符串可以通过 .. 连接符做连接操作。Lua语言提供了数值与字符串之间的自动转换。但如果想要显示地将字符串转换为数值可以调用tonumber函数。同样的tostring函数则可以将数值转换成字符串。需要注意的是,比较操作符不会进行强制类型转换。

Lua同时提供了一个字符串标准库用作处理字符串。string.sub(s, i, j)从字符串s中提取到第i个字符到第j个字符。

string.char 和 string.byte用于转换字符及其内部数值表示。

string.format则是提供了将字符串格式化和将数值输出为字符串的强大工具

string.gsub把匹配的字符串进行替换。

string.gsub("hello world", "l", ".") --he..o wor.d 3
string.gsub("hello world", "ll", "..") --he..o world 1
string.gsub("hello world", "a", ".") --hello world 0

Unicode编码

UTF-8是Web环境中用于Unicode的主要编码之一,它使用变长的多个字节来编码一个Unicode字符。具体来说, UTF-8使用一个字节表示所有ASCII字符,对于其他字节则用字节序列表示.

字符串标准库为我们提供了处理UTF-8字符串的能力。 针对一个字符的标准库函数将不再适用。

string.len和string.sub都可以正常使用

utf8.char 和 utf8.codepoint类比于 string.char 和 string.byte.

utf8标准库有一个函数utf8.codes, 该函数可用于遍历UTF-8字符串中的每一个字符

for i, c in utf8.codes("utf-8字符串") do
    print(i,c)
end

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值