字符集编码
junJZ_2008
这个作者很懒,什么都没留下…
展开
-
Jsp页面中的字符编码方式与乱码解决方案
JSP/Servlet中的编码方式在JSP/Servlet中主要有以下几个地方可以设置编码, pageEncoding="UTF-8" contentType="text/html;charset=UTF-8" request.setCharacterEncoding("UTF-8") response.setCharacterEncoding("UTF-8") 其中前...原创 2009-10-29 23:10:18 · 487 阅读 · 0 评论 -
Unicode 编码表
http://zh.wikibooks.org/w/index.php?title=Unicode2009-11-12 00:27:33 · 160 阅读 · 0 评论 -
GBK编码表
http://users.ir-lab.org/~taozi/GBK1.txt2009-11-12 00:07:46 · 207 阅读 · 0 评论 -
ISO/IEC 8859
ISO/IEC 8859ISO 组织在 1998 年之后,陆续发表了一系列代号为 8859 的标准,作为 ASCII 编码的标准扩展,终于统一了单字节的西方字符的编码。 ISO 是设在瑞士的国际标准化组织的简称( I nternational O rganization for S tandardization )。 ISO 8859,全称ISO/IEC 885...2009-11-10 23:27:39 · 429 阅读 · 0 评论 -
ASCII
ASCIIASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母(罗马字母)的一套电脑编码系統,由美国国家标准学会(American National Standard Institute , ANSI )制定的。它主要用于显示現代英語和其他西歐語言。它是現今最通用的...原创 2009-11-09 23:59:56 · 138 阅读 · 0 评论 -
JSP页面编译成Servlet类文件过程中所涉及到的编码问题
当请求一个JSP页面时,一般的都需要经历下面几个阶段:1、应用服务器根据JSP页面生成一个Java文件2、应用服务器调用java.exe将Java文件编译成一个Servlet对应的class文件3、用户的浏览器请求JSP对应的Servlet,Web容器起一个线程执行Servlet,将数据返回给客户端浏览器...2009-11-07 18:27:42 · 237 阅读 · 0 评论 -
Java中的字符集编码入门(六)Java中的增补字符
Java号称对Unicode提供天然的支持,这话在很久很久以前就已经是假的了(不过曾经是真的),实际上,到JDK5.0为止,Java才算刚刚跟上Unicode的脚步,开始提供对增补字符的支持。 现在的Unicode码空间为U+0000到U+10FFFF,一共1114112个码位,其中只有1,112,064 个码位是合法的(我来替你做算术,有2048个码位不合法),但并不是说现在的Uni...原创 2009-11-07 16:17:08 · 196 阅读 · 0 评论 -
Java中的字符集编码入门(五)Java代码中的字符编码转换Part 1
如果你是JVM的设计者,让你来决定JVM中所有字符的表示形式,你会不会允许使用各种编码方式的字符并存? 我想你的答案是不会,如果在内存中的Java字符可以以GB2312,UTF-16,BIG5等各种编码形式存在,那么对开发者来说,连进行最基本的字符串打印、连接等操作都会寸步难行。例如一个GB2312的字符串后面连接一个UTF-8的字符串,那么连接后的最终结果应该是什么编码的呢?你选哪...2009-11-07 15:50:33 · 120 阅读 · 0 评论 -
Java中的字符集编码入门(四)网页文件的编码
接着上节的思路说,一个网页要想在浏览器中能够正确显示,需要在三个地方保持编码的一致:网页文件,网页编码声明和浏览器编码设置。 首先是网页文件本身的编码,即网页文件在被创建的时候使用什么编码来保存。这个完全取决于创建该网页的人员使用了什么编码保存,而进一步的取决于该人员使用的操作系统。例如我们使用的中文版WindowsXP系统,当你新建一个文本文件,写入一些内容,并按下ctrl+s进行保...原创 2009-11-07 15:15:19 · 91 阅读 · 0 评论 -
Java中的字符集编码入门(三)GB2312,GBK与中文网页
GB2312是对中国的开发人员来说很重要的一个词汇,它的来龙去脉并不需要我在这里赘述,随便Goolge之便明白无误。我只是想提一句,记得前一节说到编码字符集和字符集编码不是一回事,而有的字符集编码又实际上没有做任何事,GB2312正是这样一种东西! GB2312最初指的是一个编码字符集,其中包含了ASCII所包含的英文字符,同时加入了6763个简体汉字以及其他一些ASCII之外的符号。...原创 2009-11-07 15:00:51 · 145 阅读 · 0 评论 -
Java中的字符集编码入门(二)编码字符集与字符集编码的区别
需要再一次强调的是,无论历史上的UCS还是现如今的Unicode,两者指的都是编码字符集,而不是字符集编码。花费一点时间来理解好这件事,然后你会发现对所有网页的,系统的,编码标准之间的来回转换等等繁杂事务都会思路清晰,手到擒来。 首先说说最一般意义上的字符集。 一个抽象字符集其实就是指字符的集合,例如所有的英文字母是一个抽象字符集,所有的汉字是一个抽象字符集,当然,把全世界...原创 2009-11-07 14:27:46 · 122 阅读 · 0 评论 -
Java中的字符集编码入门(一)Unicode与UCS的历史恩怨
ASCII及相关标准 地球人都知道ASCII就是美国标准信息交换码的缩写,也知道ASCII规定用7位二进制数字来表示英文字符,ASCII被定为国际标准之后的代号为ISO-646.由于ASCII码只使用了7个二进制位,也就是说一个字节可以表示的256个数字中,它仅使用了0~127这128个码位,剩下的128个码位便可以用来做扩展,用来表示一些特定语言所独有的字符,因此对这多余的128个...原创 2009-11-07 13:59:01 · 89 阅读 · 0 评论 -
JSP页面编码问题研究
问题 曾经有一个网友问过我这样一个问题:<%@page contentType="text/html; charset=UTF-8"%><html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"></原创 2009-11-07 12:23:32 · 89 阅读 · 0 评论 -
ISO8859-1字符集与其他字符集兼容性测试
ISO8859-1字符集中所有字符只占一个字节,8位,一个字节的编码空间为0x00-0xFF共256个字符。 ISO8859-1字符集中的部分(GBK GB2312 )或全部(UTF-8 UTF-16)字符在其他字符集中会存在,而且编码值还相同。 当把一个字符集中某个字符转换成另外一种字符集中的字符时,在转换过程中会有很大一部分字符在另一种字符集中是没有的(比如GBK繁体字符到GB...2009-11-07 00:41:24 · 739 阅读 · 0 评论 -
HTTP码流与Jsp乱码问题的分析(二)
上一节我是用的GB2312编码方式的页面来测试的,这一节我用UTF-8页面来测试一下。问题一问题出现时环境:1、以POST方式提交表单2、请求的URL后还附加参数且参数值含有中文3、附加参数值经过了encodeURIComponent()函数编码4、Tomcat未设置URIEncoding与useBodyEncodingForURI5、请求页面与结果页面<%@ page %>...2009-11-01 16:26:44 · 1216 阅读 · 0 评论 -
HTTP码流与Jsp乱码问题的分析(一)
测试环境 服务器:Tomcat5.5 浏览器:Firfox3.5、IE7.0HTTP码流服务端截取程序import java.io.IOException;import java.io.InputStream;import java.io.OutputStreamWriter;import java.io.UnsupportedEncodingException;i...2009-11-01 14:19:00 · 912 阅读 · 0 评论 -
文件的字节顺序记号
字节顺序记号是编码为 U+FEFF 的统一码字符("零宽度无断空白")。当以 UTF-16 或 UTF-32 来对UCS或Unicode字符编码时,这个字符被用来标示其字节序。它常被用来当做标示文件是 UTF-8 、 UTF-16 或 UTF-32 编码格式的文件记号。UTF-8 则没有字节顺序的概念。UTF-8编码过的字节顺序记号则被用来标示它是 UTF-...2009-11-12 02:26:18 · 178 阅读 · 0 评论