自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

狼行千里吃肉

无论前程是喜是忧,我自无怨无悔

  • 博客(5)
  • 收藏
  • 关注

原创 第五章:其他

UTF UTF-8/16/32,这里面的阿拉伯数字到底代表什么含义呢? UTF8中的8代表最小以8位为一个代码单元即1个字节。 UTF16代表最小用16位为一个代码单元即2个字节。 UTF32则以32位为一个代码单元即4个字节。 这些代码单元是最小单位,不能分割,因此,具体位数只能是某个代码单元的整数倍。 代码单元有什么用呢,这里以java语言中的String来举例: String在...

2020-03-03 14:29:14 122

原创 第四章:编号如何转化成encoding

encoding长度问题 当我们在网络传输信息的时候,底层是按照0/1方式来传输,问题来了,当接收方接收到一连串0/1之后,接收方该如何分割0/1字符串呢? ASCII一开始1字节(8位)来传输,后来GB2312采取变长方式来编码,这是因为当遇到汉字时采取2字节编码,遇到ASCII再用1字节编码,说白了GB2312动态变化主要是为了兼容1字节的ASCII。 再加上其他国家的国家标准,因此不同...

2020-03-03 14:28:43 179

原创 第三章:charset与encoding映射

charset与encoding并不是直接映射,这里有个编号的概念,即: charset首先映射到编号,chatset与编号是一对一映射; 然后编号再去映射encoding,而编号与encoding是一对多关系,例如UTF8/16/32等。 这里的编号就是类似于execl,分为水平方向与垂直方向,水平方向与垂直方向都有一个编号,这样每个字符都会落在这个表格中进而就能获取其在水平、垂直方向上的...

2020-03-03 14:27:17 141

原创 第二章:JSP引出的问题

在JSP文件中,我们会经常发现如下2个关于字符的代码: contentType中的charset,还有就是JSP的pageEncoding。那charset与encoding怎么会有这2个名词呢? 答:charset全称是character set,中文名是字符集。 encoding全称是charset encoding,中文名称是字符集编码,简称编码。 那这2个名词之间有什么区别吗? ...

2020-03-03 14:26:45 125

原创 第一章:事情起因

之前负责了一个2008年的项目,该项目字符集是GBK,由于连续出现了各种只属于GB18030字符集的生僻字之后,导致应用不得不从GBK升级为GB18030字符集。 本以为升级到GB18030后就万事大吉了,结果还是不行,明明有些字属于GB18030,后台接受后还是乱码,没办法,只能拿出时间来研究这个问题。 既然拿出时间来解决这事了,那就整理下自己这几天看到的网上资料吧。 ...

2020-03-03 14:26:12 197

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除