编码

546232194@zsw

于 2021-04-25 14:53:46 发布

阅读量157

点赞数 1

分类专栏：工具中间件 java学习文章标签： unicode

本文链接：https://blog.csdn.net/zsw5462321945/article/details/116128844

版权

java学习同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

工具中间件

6 篇文章 0 订阅

订阅专栏

1. ASCII

ASCII 只有127个字符，表示英文字母的大小写、数字和一些符号，但由于其他语言用ASCII 编码表示字节不够，例如：常用中文需要两个字节，且不能和ASCII冲突，中国定制了GB2312编码格式，相同的，其他国家的语言也有属于自己的编码格式

2. Unicode

由于每个国家的语言都有属于自己的编码格式，在多语言编辑文本中会出现乱码，这样Unicode应运而生，Unicode就是将这些语言统一到一套编码格式中，通常两个字节表示一个字符，而ASCII是一个字节表示一个字符，这样如果你编译的文本是全英文的，用Unicode编码比ASCII编码需要多一倍的存储空间，在存储和传输上就十分不划算

3. UTF-8

为了解决上述问题，又出现了把Unicode编码转化为“可变长编码”UTF-8编码，UTF-8编码将Unicode字符按数字大小编码为1-6个字节，英文字母被编码成一个字节，常用汉字被编码成三个字节，如果你编译的文本是纯英文的，那么用UTF-8就会非常节省空间，并且ASCII码也是UTF-8的一部分。

ASCII utf-8 编码就是把字符或者汉字编程字节码（字节码是二进制或者其他进制文件的统称，成为字节码后编译成机器码，电脑就可以认识了）
String zsw = new String("zsw");
byte[] bytes = zsw.getBytes();
System.out.println(Arrays.toString(bytes));//[122, 115, 119] 'z'的ascll码为122(十进制)
String s = new BigInteger(zsw.getBytes()).toString(16);
System.out.println(s);//7a7377 122转16进制为7a

546232194@zsw

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
编码

1. ASCIIASCII 只有127个字符，表示英文字母的大小写、数字和一些符号，但由于其他语言用ASCII 编码表示字节不够，例如：常用中文需要两个字节，且不能和ASCII冲突，中国定制了GB2312编码格式，相同的，其他国家的语言也有属于自己的编码格式2. Unicode由于每个国家的语言都有属于自己的编码格式，在多语言编辑文本中会出现乱码，这样Unicode应运而生，Unicode就是将这些语言统一到一套编码格式中，通常两个字节表示一个字符，而ASCII是一个字节表示一个字符，这样如果你
复制链接

扫一扫

专栏目录