获取一个字符串的utf8格式下的长度,并且返回一个存储着每个单字的表
function string.utf8Len(str)
local len = #str
local left = 0
local arr = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc}
local length = 0
local startNum = 1
local wordLen = 0
local strTb = {}
while left ~= len do
local temp = string.byte(str, startNum)--将字符串的某个字符转换成十六进制
local i = #arr
while arr[i] do
if temp >= arr[i] then
left = left + i
break
end
i = i - 1
end
length = length + 1
wordLen = i + wordLen
local tmpString = string.sub(str, startNum, wordLen)
startNum = startNum + i
strTb[#strTb + 1] = tmpString
end
return length, strTb
end
string.char 函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,
将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)
将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。
下面的例子中,我们假定字符用ASCII表示:
print(string.char(97)) --> a
i = 99; print(string.char(i, i+1, i+2)) --> cde
print(string.byte("abc")) --> 97
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99
上面最后一行,我们使用负数索引访问字符串的最后一个字符。