问题:给出一个整数串,判断是否是合法的UTF-8编码
对于 1 字节的字符,字节的第一位设为0,后面7位为这个符号的unicode码。
对于 n 字节的字符 (n > 1),第一个字节的前 n 位都设为1,第 n+1 位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的unicode码。
思路:直接根据定义来做
具体代码参考:
https://github.com/wuli2496/OJ/tree/master/LeetCode/UTF-8%20Validation
本文介绍如何判断一个整数串是否符合UTF-8编码规则。UTF-8编码中,1字节字符首字节第一位为0,后续7位为Unicode码;n字节字符(n>1)首字节前n位为1,第n+1位为0,后续字节前两位为10,其余位为Unicode码。文章提供直接依据定义进行判断的思路。

被折叠的 条评论
为什么被折叠?



