基于正则表达式计算UTF8编码字符串中的总字符数(附Lua版代码)
测试代码:
(local s = "①贰a190A#}。!!"是测试用的字符串)
function stringToTable(s)
local tb = {}
--[[
UTF8的编码规则:
1. 字符的第一个字节范围: 0x00—0x7F(0-127),或者 0xC2—0xF4(194-244);
UTF8 是兼容 ascii 的,所以 0~127 就和 ascii 完全一致
2. 0xC0, 0xC1,0xF5—0xFF(192, 193 和
原创
2021-08-28 16:33:20 ·
327 阅读 ·
0 评论