Unicode介绍

原创 2007年10月08日 10:18:00

很早就知道这个概念,只知道是提供全球统一的编码,今天仔细搜索了一下。

问:什么是Unicode?
答:Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode标准已经被这些工业界的领导们所采用,例如:Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys和其它许多公司。最新的标准都需要Unicode,例如XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML等等,并且,Unicode是实现ISO/IEC 10646的正规方式。许多操作系统,所有最新的浏览器和许多其他产品都支持它。Unicode标准的出现和支持它工具的存在,是近来全球软件技术最重要的发展趋势。

问:为什么使用Unicode?
答:基本上,计算机只是处理数字。它们指定一个数字,来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符:例如,单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。这些编码系统也会互相冲突。也就是说,两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机(特别是服务器)都需要支持许多不同的编码,但是,不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。

问:举个例子吧。
答:比如,简体中文(GB)、繁体中文(BIG5)、日文中,“赵”都是一个字,但是编码不同。在不同的编码下,BIG5的赵是0xBBAF,而0xBBAF在GB里面就被显示为“化”,这就是乱码。而Unicode采用统一的编码,“赵”只有一个,不必管他在哪种文字里。

问:Unicode的优点是什么?
答:举一个最明显的例子就是Windows 2000/XP以及微软Office2000及其后的产品。因为这些软件都是Unicode内核,因此,无论何种文字,都可以在上面正常显示,而且是同屏显示。以前,简体中文的Word文件拿到英文版打开就会是乱码,简体中文的程序在Windows英文版上运行会出现乱码,而现在一切都解决了。 

在线转换工具:http://www.chinaue.com/tool/uni.htm

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

Unicode知识介绍

  • 2011-09-29 14:39
  • 303KB
  • 下载

写给程序员的 Unicode 入门介绍

本文转自 微信公众号 jobbole 程序员世界对这个名字发自内心的恐惧和敬畏。我们都知道在我们的软件中应该 “支持 Unicode”(无论是什么意思——对所有的字符串使用 wchar_t,是吗?)。...

ANIS与UNICODE字符格式转换:MultiByteToWideChar()和WideCharToMultiByte()函数介绍

第一个就是宽字符到多字节字符转换函数,函数原型如下: int WideCharToMultiByte( UINT CodePage, DWORD dwFlags, LPCWSTR lpWid...

Unicode(UTF-8, UTF-16)、Ansi、GB2312、GBK等编码介绍

以下内容来自:http://www.cnblogs.com/kingcat/archive/2012/10/16/2726334.html 为啥需要Unicode         我...

python 中unicode编码解码介绍,解决各种编码类错误

一、编码的种种问题 背景: 使用linux开发环境,scureCRT客户端;想使用utf-8编码         1. 程序文件编码 就是你的程序文本文件保存时选取的编码,通过 file -i ...

UTF,ISO8859-1,Unicode,GBK之间的关系的介绍

UTF,ISO8859-1,Unicode,GBK之间的关系的介绍

gbk, gb2312,big5,unicode,utf-8,utf-16的区别详细介绍

标题 谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词 选择自 fmddlmyy 的 Blog 关键字 谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词 这是一...

Unicode详细介绍

转贴自:http://blog.chinaunix.net/uid-10468429-id-2953054.html 1. 编码知识 1.1 文本和字符 在计算机程序中或者数据文件里,文本(...

编码介绍--gbk, gb2312,big5,unicode,utf-8,utf-16之间的关系

转http://www.cppblog.com/qiujian5628/archive/2008/01/24/41773.html

字符编码介绍(二)Unicode

根据上一篇介绍的编码背景知识,我们知道,世界上存在着多种编码方式(计算机传到世界各个国家时,为了适合当地语言和字符,设计和实现类似GB2312/GBK/BIG5的编码方案),同一个二进制数字可以被解释...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)