![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
字符与编码
夜_孤城
程序猿的自我救赎。。。
展开
-
字符集与编码一之charset and encoding
许多时候,字符集与编码这两个概念常被混为一谈,但两者是有差别的,作为深入理解的第一步,首先要明确:字符集与字符集编码是两个不同层面的概念charset是character set的简写,即字符集。encoding是charset encoding的简写,即字符集编码,简称编码。与接口及接口实现的对比可以把这两者与接口及接口实现做个对比:转载 2017-04-18 14:24:34 · 570 阅读 · 0 评论 -
乱码问题之文件,文本文件以及编码
在前面的字符集编码系列中,已经探讨了几大主要的字符集编码。在此基础之上,这里将进一步探讨编码的应用及乱码的根源,我们先从基本的文件说起。文件文件(内容)就是字节序列。文本文件也是文件,所以它也是字节序列。文件名与文件内容通常说到文件时,指的是文件内容,但文件还有文件名,文件名与文件内容是分开存储的。你可以在硬盘上新建一个文件,它的大小为0.如下:但它是有文件名的转载 2017-04-19 10:43:37 · 3924 阅读 · 1 评论 -
字符集与编码八之ASCII和ISO-8859-1
在前面其实也谈到了ASCII了,但并没有很具体,作为一个完整系列的一部分,还是有必要谈一下,也作为后面讨论的一些基础。ASCII它的全称是American Standard Code for Information Interchange(美国信息交换标准代码),是一个7位字符编码方案。下面是它的一张简图(来自http://www.asciitable.com/index/asci转载 2017-04-19 10:07:42 · 3325 阅读 · 0 评论 -
字符集与编码七之BOM
在前一篇的最后,留下了一个问题,即string.getBytes(“UTF-16”)会在开头多出两个字节”FEFF”来,Unicode中称之为BOM,接下来就让我们一起来了解有关BOM的知识,在此之前我们需要说说有关端法的知识。什么是端法(endian)?在具体介绍它之前,让我们先看看鸡蛋的两种摆法:大家看出区别来了吗?上面的一排都是尖的一端(或者说小端)向着左,较圆的一端转载 2017-04-19 09:48:40 · 1324 阅读 · 0 评论 -
字符集与编码五之代码单元及length方法
在前一篇章中已经谈了不少Unicode中的重要概念,但仍还有一些概念没有提及,一则不想一下说太多,二则有些概念也无法三言两语就说清楚,本文在此准备谈一下代码单元及由此引发的一些话题。什么是代码单元?UTF-8,UTF-16和UTF-32中的8,16和32究竟指什么?代码单元指一种转换格式(UTF)中最小的一个分隔,称为一个代码单元(Code Unit),因此,一种转换格式只会包含整转载 2017-04-18 15:42:44 · 776 阅读 · 0 评论 -
字符集与编码四之Unicode
前面谈到不少的Unicode,但一直没有系统地谈及Unicode的方方面面,所以本篇文章专门谈谈Unicode,当然了,Unicode是一个庞大的主题,这里也是拣些重要的方面谈谈而已,免不了挂一漏万。什么是Unicode?按Unicode官方的说法,Unicode是Unicode Standard(Unicode标准)的简写,所以Unicode即是指Unicode标准。按wik转载 2017-04-18 15:23:45 · 663 阅读 · 0 评论 -
字符集与编码三之定长与变长
☯,首先,这并不是图片,这是一个unicode字符,Yin Yang,即阴阳符,码点为U+262F。如果你的浏览器无法显示,可以查看这个链接http://www.fileformat.info/info/unicode/char/262f/index.htm。这与我们要讨论的主题有何关系呢?下面我会谈到。连续式表示带来的分隔难题计算机的底层表示在计算机的最底层,一切都成了0转载 2017-04-18 14:46:14 · 2895 阅读 · 0 评论 -
字符集与编码二之编号 vs 编码
在深入研究字符集编码,简称编码之前,我们先引入一个概念:编号(code),引入它是为了更好地与编码(encode)相区分。如果你对Unicode有深入了解,你也许已经意识到了Unicode中码点(code point)扮演的正是编号的角色。类似的还有GB系列中所谓的区位码。其实叫什么并不重要,爱咋咋地,我并不关心。但乱叫容易叫混了,比如把码点也叫成Unicode编码,这里先把这些归转载 2017-04-18 14:43:36 · 642 阅读 · 1 评论 -
JDK目录结构和文件作用介绍
要想深入了解Java必须对JDK的组成, 本文对JDK6里的目录做了基本的介绍,主要还是讲解了下JDK里的各种可执行程序或工具的用途Java(TM) 有两个平台 JRE 运行平台,包括Java虚拟机,运行类库,java应用程序装载器。JRE不是开发环境,所以不包括编译器,调试器,有需要这些请安装JDK(TM) //说明 :环境为Windows XP SP3 下 的JDK为转载 2017-04-19 14:16:46 · 1757 阅读 · 0 评论