乱码
乱码
如果时光可以倒流,我会选择在家陪伴家人
这个作者很懒,什么都没留下…
展开
-
第五章:其他
UTFUTF-8/16/32,这里面的阿拉伯数字到底代表什么含义呢?UTF8中的8代表最小以8位为一个代码单元即1个字节。UTF16代表最小用16位为一个代码单元即2个字节。UTF32则以32位为一个代码单元即4个字节。这些代码单元是最小单位,不能分割,因此,具体位数只能是某个代码单元的整数倍。代码单元有什么用呢,这里以java语言中的String来举例:String在...原创 2020-03-03 14:29:14 · 123 阅读 · 0 评论 -
第四章:编号如何转化成encoding
encoding长度问题当我们在网络传输信息的时候,底层是按照0/1方式来传输,问题来了,当接收方接收到一连串0/1之后,接收方该如何分割0/1字符串呢?ASCII一开始1字节(8位)来传输,后来GB2312采取变长方式来编码,这是因为当遇到汉字时采取2字节编码,遇到ASCII再用1字节编码,说白了GB2312动态变化主要是为了兼容1字节的ASCII。再加上其他国家的国家标准,因此不同...原创 2020-03-03 14:28:43 · 180 阅读 · 0 评论 -
第三章:charset与encoding映射
charset与encoding并不是直接映射,这里有个编号的概念,即:charset首先映射到编号,chatset与编号是一对一映射;然后编号再去映射encoding,而编号与encoding是一对多关系,例如UTF8/16/32等。这里的编号就是类似于execl,分为水平方向与垂直方向,水平方向与垂直方向都有一个编号,这样每个字符都会落在这个表格中进而就能获取其在水平、垂直方向上的...原创 2020-03-03 14:27:17 · 142 阅读 · 0 评论 -
第二章:JSP引出的问题
在JSP文件中,我们会经常发现如下2个关于字符的代码:contentType中的charset,还有就是JSP的pageEncoding。那charset与encoding怎么会有这2个名词呢?答:charset全称是character set,中文名是字符集。encoding全称是charset encoding,中文名称是字符集编码,简称编码。那这2个名词之间有什么区别吗?...原创 2020-03-03 14:26:45 · 126 阅读 · 0 评论 -
第一章:事情起因
之前负责了一个2008年的项目,该项目字符集是GBK,由于连续出现了各种只属于GB18030字符集的生僻字之后,导致应用不得不从GBK升级为GB18030字符集。本以为升级到GB18030后就万事大吉了,结果还是不行,明明有些字属于GB18030,后台接受后还是乱码,没办法,只能拿出时间来研究这个问题。既然拿出时间来解决这事了,那就整理下自己这几天看到的网上资料吧。...原创 2020-03-03 14:26:12 · 198 阅读 · 0 评论