Unicode

原创 2004年07月02日 10:37:00

Unicode 问答

 

问:什么是Unicode?
答:Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode标准已经被这些工业界的领导们所采用,例如:Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys和其它许多公司。最新的标准都需要Unicode,例如XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML等等,并且,Unicode是实现ISO/IEC 10646的正规方式。许多操作系统,所有最新的浏览器和许多其他产品都支持它。Unicode标准的出现和支持它工具的存在,是近来全球软件技术最重要的发展趋势。

问:为什么使用Unicode?
答:基本上,计算机只是处理数字。它们指定一个数字,来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符:例如,单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。这些编码系统也会互相冲突。也就是说,两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机(特别是服务器)都需要支持许多不同的编码,但是,不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。

问:举个例子吧。
答:比如,简体中文(GB)、繁体中文(BIG5)、日文中,“赵”都是一个字,但是编码不同。在不同的编码下,BIG5的赵是0xBBAF,而0xBBAF在GB里面就被显示为“化”,这就是乱码。而Unicode采用统一的编码,“赵”只有一个,不必管他在哪种文字里。

问:Unicode的优点是什么?
答:举一个最明显的例子就是Windows 2000/XP以及微软Office2000及其后的产品。因为这些软件都是Unicode内核,因此,无论何种文字,都可以在上面正常显示,而且是同屏显示。以前,简体中文的Word文件拿到英文版打开就会是乱码,简体中文的程序在Windows英文版上运行会出现乱码,而现在一切都解决了。

Unicode字符列表

代码 显示 描述 U+0020 空格 U+0021 ! 叹号 U+0022 " 双引号 U+0023 # 井号 U+0024 $ 价钱/货币符号 U+0025 % ...
  • saycheesenn
  • saycheesenn
  • 2016年10月28日 10:26
  • 1041

【整理】ANSI和UNICODE字符串处理函数

字符串处理函数常用函数对照 ANSI UNICODE 通用 说明 数据类型 (char.h) (wchar.h) (tchar.h)   cha...
  • chenzy945
  • chenzy945
  • 2016年07月17日 10:41
  • 2308

unicode编码规则

一、Unicode与UTF-8之间的的关系 Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。 比如“二”字的unicode十六进制编码是:“4E8C...
  • u014200359
  • u014200359
  • 2014年04月13日 20:53
  • 2251

MFC与unicode的纠结

关于MFC的小总结
  • w417950004
  • w417950004
  • 2015年09月17日 20:31
  • 918

按行读取ANSI、UNICODE 、UNICODE big endian、UTF-8四种文本文

代码简介 1.问题提出 MFC提供的文件类CStdioFile,其中一个函数ReadString实现了文件的按行读取,但是不能满足不同类型的文本文件的按行读取,为了解决这一问题,笔者初步研究了一些...
  • sky101010ws
  • sky101010ws
  • 2016年06月20日 16:35
  • 1668

特殊符号 UNICODE编码

⇠  箭头类 符号 UNICODE 符号 UNICODE HTML JS CSS HTML JS CSS ...
  • Tectool
  • Tectool
  • 2016年06月03日 12:22
  • 14922

说一说ASCLL和Unicode

关于字符编码这个展开来说有太多东西了,这里主要是想说一说最常说的ASCLL和Unicode字符编码的问题,这样至少你在用相关函数的时候,可以搞明白参数的真正含义。读完这篇博客相信你对编码相关函数的使用...
  • wenzhou1219
  • wenzhou1219
  • 2015年03月21日 09:57
  • 5965

Unicode字符编码—就这么回事

Unicode全称应该是unity code ,翻译过来就是统一码。意思嘛,就是统一地球上所有字符的编码。编码是什么东西呢?就是把一个东西用一个数字来表示(广义上的概念不是这样,但这里可以这么理解)。...
  • u012672456
  • u012672456
  • 2015年03月30日 14:14
  • 1716

关于Unicode字符集

原文链接:http://blog.sina.com.cn/s/blog_4b4409c30100vw9t.html 最初的unicode编码是固定长度的,16位,也就是2两个字节代表一个字符,这样一共...
  • yang3wei
  • yang3wei
  • 2015年08月11日 08:54
  • 1632

SSIS无法在unicode和非unicode 字符串数据类型之间转换

场景:SSIS从oracle抽到sqlserver,一个表对表到数据仓库ODS层的抽取,没有任何逻辑结果遇到问题: SSIS无法在unicode和非unicode 字符串数据类型之间转换 如下图2...
  • goodmoringking
  • goodmoringking
  • 2017年07月12日 17:23
  • 625
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Unicode
举报原因:
原因补充:

(最多只允许输入30个字)