lua 计算utf8格式的字符串的长度

获取一个字符串的utf8格式下的长度,并且返回一个存储着每个单字的表     

function string.utf8Len(str)
        local len = #str
        local left = 0
        local arr = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc}
        local length = 0
        local startNum = 1
        local wordLen = 0
        local strTb = {}
        while left ~= len do
            local temp = string.byte(str, startNum)--将字符串的某个字符转换成十六进制            
            local i = #arr
            while arr[i] do
                if temp >= arr[i] then
                    left = left + i
                    break
                end
                i = i - 1
            end
            length = length + 1

            wordLen = i + wordLen
            local tmpString = string.sub(str, startNum, wordLen)
            startNum = startNum + i
            strTb[#strTb + 1] = tmpString
        end

        return length, strTb
    end


string.char 函数和string.byte函数用来将字符在字符和数字之间转换。string.char获取0个或多个整数,
将每一个数字转换成字符,然后返回一个所有这些字符连接起来的字符串。string.byte(s, i)
将字符串s的第i个字符的转换成整数;第二个参数是可选的,缺省情况下i=1。
下面的例子中,我们假定字符用ASCII表示:
print(string.char(97)) --> a
i = 99; print(string.char(i, i+1, i+2)) --> cde
print(string.byte("abc")) --> 97
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99
上面最后一行,我们使用负数索引访问字符串的最后一个字符。

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值