javaWeb汉字乱码问题

最新推荐文章于 2023-10-29 23:05:12 发布

toward_south

最新推荐文章于 2023-10-29 23:05:12 发布

阅读量621

点赞数

分类专栏： java web

java web 专栏收录该内容

22 篇文章 0 订阅

订阅专栏

charset=这个设置为UTF-8

pageEncoding=UTF-8

meta里面这个charset设置UTF-8或者GBK

编码方式：

　　　1、ASCII 码

　　　　　　　众所周知，这是最简单的编码。它总共可以表示128个字符，0~31是控制字符如换行、回车、删

　　　　除等，32~126是打印字符，可以通过键盘输入并且能够显示出来的。

　　　　2、ISO-8859-1

　　　　　　它是基于ASCII码基础上扩展的，它总共能表示256个字符，涵盖了大多数西欧语言字符。详见

　　　　ISO-8859-1 编码该编码不支持中文，举个中文编码栗子:

　　　　字符串“I am 君山”用 ISO-8859-1 编码，下面是编码结果：

　　　　

　　　　由于ISO-8859-1 是单字节编码且不支持中文，直接将中文字符转成‘3f’, 3f也就是常见的"?"字符

　　　　3、GB2312

　　　　　　它是双字节编码，共包含6763个汉字。

　　　　4、GBK

　　　　　　汉字内码扩展规范，是基于GB2312上拓展的，加入了更多的汉字，能表示21003个汉字。它的编码

　　　　是和GB2312兼容的。也就是说用GB2312编码的汉字可以用GBK来解码，并且不会乱码。倒过来就不完

　　　　全可以了，因为GB2312描述的汉字比GBK少。

　　　　5、UTF-16

　　　　　　UTF-16是基于Unicode上定义的，用两个字节来表示Unicode的转换格式，它采用定长的表示方法，

　　　　即不能什么字符都可以用两个字节表示。两个字节是16个bit，所以就做UTF-16。（Unicode 囊括了世界

　　　　上所有语言，所有语言均可通过Unicode来相互翻译，详解 Unicode 编码）

　　　　6、UTF-8

　　　　　　由于UTF-16统一采用两个字节来表示一个字符，有很多字符用一个字节表示即可。所以存储空间放

　　　　大了一倍，还会增加网络传输的流量,所以推出了UTF-8。 UTF-8采用了一种变长技术，每个编码区域有

　　　　不同的字码长度。

　　　　通过上面介绍和对比，对于中文字符的处理我想UTF-8是最理想的中文编码。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
javaWeb汉字乱码问题

charset=这个设置为UTF-8pageEncoding=UTF-8meta里面这个charset设置UTF-8或者GBK编码方式：　　　1、ASCII 码　　　　　　　众所周知，这是最简单的编码。它总共可以表示128个字符，0~31是控制字符如换行、回车、删　　　　除等，32~126是打印字符，可以通过键盘输入并且能够显示出来的。　　　　2、ISO-8859-1　　　　　　它是基于ASCII...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。