综合
jvortex
这个作者很懒,什么都没留下…
展开
-
编码基础知识
最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。 1.1. iso8859-1 通常叫做Latin-1 属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母a的编码为0x61=97。 很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于转载 2017-06-28 15:51:31 · 438 阅读 · 0 评论 -
字符编码笔记:ASCII,Unicode和UTF-8
1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位转载 2017-06-28 21:53:19 · 292 阅读 · 0 评论 -
字符编码杂谈
字符编码杂谈基础知识准备字符编码笔记:ASCII,Unicode和UTF-8准备工具notepad++添加16进制插件Unicode与UTF-8的异同Unicode只是一个符号集,它只规定了符号的二进制代码,而不是二进制代码的一种存储方式。而utf-8、gbk、ascII它们有自己的编码集,但同时也是一种存储方式。UTF-8把字符的Unicode编码根据大小进行分类存储,有的使用一个字节,有的使原创 2017-07-20 10:40:03 · 2414 阅读 · 1 评论 -
java字符编码转换研究
1. 概述本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687"。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来"表示"。2. 编码转载 2017-08-10 18:50:53 · 385 阅读 · 0 评论