Character Code
meander
三年Java开发经验,两年C#开发经验。善于使用eclipse和visual studio开发工具。从事过ERP和数据存储软件开发。专注于企业集成。
展开
-
关于字符编码,你所需要知道的
<br />字符编码的问题看似很小,经常被技术人员忽视,但是很容易导致一些莫名其妙的问题。这里总结了一下字符编码的一些普及性的知识,希望对大家有所帮助。还是得从ASCII码说起<br />说到字符编码,不得不说ASCII码的简史。计算机一开始发明的时候是用来解决数字计算的问题,后来人们发现,计算机还可以做更多的事,例如文本处理。但由于计算机只识“数”,因此人们必须告诉计算机哪个数字来代表哪个特定字符,例如65代表字母‘A’,66代表字母‘B’,以此类推。但是计算机之间字符-数字的对应关系必须得一致,转载 2010-10-21 10:08:00 · 494 阅读 · 0 评论 -
中文化和国际化问题权威解析之二:Java国际化基础
<br />我们知道Unicode为国际化(I18n)提供了坚实的基础。但是Unicode不等同于国际化。使用Unicode的Java语言,若是使用不当,同样达不到国际化的目的。让我们来看一下Java是怎样处理Unicode的。Java的字符类型<br />和C语言不同,Java的字符类型“char”是一个16位长的整数,而C语言的char是8位,等同于一个字节,只能表示单字节的字符(拉丁语系文字)。所以Java可以直接用一个char来表示一个Unicode字符(包括中文、英文、日文……),大大简化了字符和转载 2010-10-27 11:20:00 · 450 阅读 · 0 评论 -
中文化和国际化问题权威解析之四:Java中文化和国际化攻略
一般攻略<br />既然在Java内部是直接使用Unicode表示一切字符的,表达中文自然不成问题。因此所谓的中文问题并不是由Java本身引起的。而是因为对Java和Unicode理解不透或应用不当引起的。下面列出的原则,是解决一切中文问题的总纲:在Java内部,正确使用Unicode标准。对于中文来说,每个汉字使用一个char表示。在所有的输入输出环节,指明正确的编码方式,进行正确的字符到字节,或字节到字符的转换。如果输入源或输出目标直接支持,尽可能直接使用Unicode进行输入输出。例如,Oracle数转载 2010-10-27 11:25:00 · 639 阅读 · 0 评论 -
中文化和国际化问题权威解析之三:Java中文问题分析
<br />本章从实际的中文问题中,分析问题的根本原因,以及解决之道。<br />注意,本章虽然着重说明“中文问题”,但本章所推出的结论却是适合于世界所有语言文字的。概述<br />我们在实际开发中碰到的中文问题,真是形形色色,无法一一列举。但是它们不是随机产生的,而是有规律可循,有办法解决的。<br />我们碰到最多的中文问题,都发生在使用Java Servlet写WEB应用时。其次,使用Java Mail API发送e-mail也会有类似的问题。从表象上区分,大致上有以下几种:好端端的中文显示成了问号“转载 2010-10-27 11:24:00 · 624 阅读 · 0 评论 -
中文化和国际化问题权威解析之一:字符编码发展历程
中文化和国际化问题权威解析之一:字符编码发展历程 收藏<br /><br />前几天看文初的《精武门之Web安全研讨会首日感受》,说到利用字符集攻击时提到以前宝宝写的一篇有关国际化的文章,趁机再次拜读了宝宝的这篇大作,不得不感慨宝宝的写作功底,无敌!这么好的文章不分享出来实在是太可惜了,在此将宝宝的大作转帖于此;作者序<br />在我开发Java程序的几年中,遇到得最多,也是别人向我提问最多的问题,就是各种各样看似稀奇古怪的中文乱码问题了。网上也有许多解释和解决Java中转载 2010-10-27 11:18:00 · 815 阅读 · 0 评论 -
详解Javascript中的Url编码/解码
摘要<br />本文主要针对URI编解码的相关问题做了介绍,对Url编码中哪些字符需要编码、为什么需要编码做了详细的说明,并对比分析了Javascript中和编解码相关的几对函数escape / unescape,encodeURI /decodeURI和encodeURIComponent / decodeURIComponent。预备知识<br /> foo://example.com:8042/over/there?name=ferret#nose <br /> /_/ /__转载 2010-10-21 10:12:00 · 644 阅读 · 0 评论 -
ISO 8859-1 Characters as Named and Numeric HTML Entities
Compatibility notes<br />All the characters from 0 through 255 are given here, including those whichare reserved in official ISO 8859-1, so that you can test your browser'scompliance. Specifically, if you are using MS-DOS or MS-Windows, check to see转载 2010-10-22 11:51:00 · 1595 阅读 · 0 评论 -
字符,字节和编码
<br />在网上看到的介绍字符编解码的非常不错的文章。<br />原文出处:http://www.regexlab.com/zh/encoding.htm引言<br />“字符与编码”是一个被经常讨论的话题。即使这样,时常出现的乱码仍然困扰着大家。虽然我们有很多的办法可以用来消除乱码,但我们并不一定理解这些办法的内在原理。而有的乱码产生的原因,实际上由于底层代码本身有问题所导致的。因此,不仅是初学者会对字符编码感到模糊,有的底层开发人员同样对字符编码缺乏准确的理解。编码问题的由来,相关概念转载 2010-10-21 10:10:00 · 389 阅读 · 0 评论 -
内容传送编码Base64原理
<br />什么是Base64?<br /> 按照RFC2045的定义,Base64被定义为:Base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式。(The Base64 Content-Transfer-Encoding is designed to represent arbitrary sequences of octets in a form that need not be humanly readable.) <br /> <br />为什么要使用转载 2011-01-28 14:50:00 · 691 阅读 · 0 评论