请求时文字被编码的部分原理；unicode编码

最新推荐文章于 2024-07-04 23:55:28 发布

zhi-z

最新推荐文章于 2024-07-04 23:55:28 发布

阅读量785

点赞数

分类专栏：注意文章标签： http

本文链接：https://blog.csdn.net/weixin_44692699/article/details/110929877

版权

注意专栏收录该内容

4 篇文章

订阅专栏

本文详细解析了Unicode编码原理，展示了如何通过不同编码方式（如UTF-8和GBK）转换中文字符，并解释了URL编码的过程及实现方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

unicode编码
\u0020 -> 空格
\u0021 -> ！ (unicode 16 进制表示)

请求时文字被编码的部分原理
https://www.qqxiuzi.cn/bianma/erjinzhi.php 转码网址

    @Test
    public void test4() throws Exception {
        String str = "中国" ;
        System.out.println(URLEncoder.encode(str));  // %E4%B8%AD%E5%9B%BD
        System.out.println(URLEncoder.encode(str,"gbk"));  // %D6%D0%B9%FA
    }

根据不同的编码，字符对应不同的字节
以中文举例，
utf8 下一个中文是 3个字节，
gbk 下一个中文是 2个字节，

一个字节是八个比特位（一位为0或1）
上述字符串utf8 下是则是 48 位
gbk下是32位
紧接着，会让4位进行一个16进制的转换，同时每2个16进制用 % 进行一个分割
所以只需要看% 用了几个，判断出是多少个字节，即可以换算出用的是什么编码

utf8下的转码
  String str = "中国" ;
 十六进制 为： E4B8ADE59BBD
 二进制为：111001001011100010101101111001011001101110111101

在这里插入图片描述
gbk 同理

请求时文字被编码的部分原理 ；unicode编码

请求时文字被编码的部分原理；unicode编码