393. UTF-8 编码验证

最新推荐文章于 2022-03-13 23:48:03 发布

m0_67265654

最新推荐文章于 2022-03-13 23:48:03 发布

阅读量506

点赞数

分类专栏： java 后端文章标签： leetcode 算法哈希算法

本文链接：https://blog.csdn.net/m0_67265654/article/details/123459953

版权

java 同时被 2 个专栏收录

52 篇文章 0 订阅

订阅专栏

后端

16 篇文章 0 订阅

订阅专栏

题目

给定一个表示数据的整数数组 data ，返回它是否为有效的 UTF-8 编码。

UTF-8 中的一个字符可能的长度为 1 到 4 字节，遵循以下的规则：

对于 1 字节的字符，字节的第一位设为 0 ，后面 7 位为这个符号的 unicode 码。
对于 n 字节的字符 (n > 1)，第一个字节的前 n 位都设为1，第 n+1 位设为 0 ，后面字节的前两位一律设为 10 。剩下的没有提及的二进制位，全部为这个符号的 unicode 码。
在这里插入图片描述

题解

class Solution {
    public boolean validUtf8(int[] data) {
        int n = data.length;
        for (int i = 0; i < n; ) {
            int t = data[i], j = 7;
            while (j >= 0 && (((t >> j) & 1) == 1)) j--;
            int cnt = 7 - j;
            if (cnt == 1 || cnt > 4) return false;
            if (i + cnt - 1 >= n) return false;
            for (int k = i + 1; k < i + cnt; k++) {
                if ((((data[k] >> 7) & 1) == 1) && (((data[k] >> 6) & 1) == 0)) continue;
                return false;
            }
            if (cnt == 0) i++;
            else i += cnt;
        }
        return true;
    }
}