lua 计算utf8格式的字符串的长度

最新推荐文章于 2024-04-29 09:25:40 发布

ONLY-only

最新推荐文章于 2024-04-29 09:25:40 发布

阅读量922

点赞数 1

文章标签： lua utf-8 utf8

本文链接：https://blog.csdn.net/u010130424/article/details/53940780

版权

获取一个字符串的utf8格式下的长度，并且返回一个存储着每个单字的表

function string.utf8Len(str)
        local len = #str
        local left = 0
        local arr = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc}
        local length = 0
        local startNum = 1
        local wordLen = 0
        local strTb = {}
        while left ~= len do
            local temp = string.byte(str, startNum)--将字符串的某个字符转换成十六进制            
            local i = #arr
            while arr[i] do
                if temp >= arr[i] then
                    left = left + i
                    break
                end
                i = i - 1
            end
            length = length + 1

            wordLen = i + wordLen
            local tmpString = string.sub(str, startNum, wordLen)
            startNum = startNum + i
            strTb[#strTb + 1] = tmpString
        end

        return length, strTb
    end

string.char 函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数，
将每一个数字转换成字符，然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)
将字符串s的第i个字符的转换成整数；第二个参数是可选的，缺省情况下i=1。
下面的例子中，我们假定字符用ASCII表示：
print(string.char(97)) --> a
i = 99; print(string.char(i, i+1, i+2)) --> cde
print(string.byte("abc")) --> 97
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99
上面最后一行，我们使用负数索引访问字符串的最后一个字符。

ONLY-only

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lua 计算utf8格式的字符串的长度

获取一个字符串的utf8格式下的长度，并且返回一个存储着每个单字的表function string.utf8Len(str)local len = #strlocal left = 0local arr = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc} local length = 0local startNum = 1local wordLen
复制链接

扫一扫