关于gbk、gb2312、utf-8

转载 2008年10月03日 02:12:00

 utf-8是基于unicode的 国际化的场合适合使用
gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字


gb2312和gbk 的一个区别是 :gb2312 出来得比较早 ,所以有一些汉字和繁体好象不支持。gbk 是一个改进

版。所以能用gbk的时候一般不用gb2312


UTF-8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种

多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有

国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示

。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。

 

GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英

文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,

通用性比UTF8差,不过UTF8占用的数据库比GBD大。

 

GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般

只支持GBK。

java编码表GBK、GB2312与UTF-8的区别

GBK、GB2312与UTF-8的区别? UTF-8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。 是用以解决国际上字符的一种多字...
  • qiushi_1990
  • qiushi_1990
  • 2014年08月08日 10:56
  • 3537

常见编码GBK、GB2312、UTF-8、ISO-8859-1的区别

在项目开发中,会经常遇到不同的编码方式。不管什么编码,都是信息在计算机中的一种表现,理解常见的编码方式,有助于我们避免出现乱码等现象。 最初的计算机字符编码是通过ASCII来编码的,是现今最通用的单...
  • shijing_0214
  • shijing_0214
  • 2016年03月16日 20:38
  • 5553

ASP写的汉字转换UTF-8及UTF-8转GB2312

汉字转换为UTF-8 function chinese2unicode(Str)   dim i   dim Str_one   dim Str_unicode   for i=1 to l...
  • hefeng_aspnet
  • hefeng_aspnet
  • 2013年09月26日 15:29
  • 2282

UNICODE\Unicode,GBK,GB2312,UTF-8概念基础

  • 2012年01月02日 20:18
  • 24KB
  • 下载

utf-8、gbk、gb2312区别

  • 2014年02月20日 23:39
  • 2KB
  • 下载

字符编码:GBK、GB2312、UTF-8

  • 2014年09月29日 13:36
  • 39KB
  • 下载

各种编码UNICODE、UTF-8、ANSI、ASCII、GB2312、GBK详解

一、编码历史与区别         一直对字符的各种编码方式懵懵懂懂,什么ANSI UNICODE UTF-8 GB2312 GBK DBCS UCS……是不是看的很晕,假如您细细的阅读本文你一定可以...
  • LVXIANGAN
  • LVXIANGAN
  • 2012年11月06日 10:33
  • 82771

ANSI、UNICODE、UTF-8、GB2312、GBK、DBCS、UCS。。。。。

一直对字符的各种编码方式懵懵懂懂,什么ANSI、UNICODE、UTF-8、GB2312、GBK、DBCS、UCS……是不是看的很晕,假如您细细的阅读本文你一定可以清晰的理解他们。Let's go...
  • houpengfei111
  • houpengfei111
  • 2012年05月31日 12:04
  • 446

JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础

这两天抽时间又总结/整理了一下各种编码的实际编码方式,和在Java应用中的使用情况,在这里记录下来以便日后参考。 为了构成一个完整的对文字编码的认识和深入把握,以便处理在Java开发过程中遇到的各种...
  • wangxingbao4227
  • wangxingbao4227
  • 2011年09月05日 11:40
  • 466

UTF-8 GBK GB2312的区别和联系

UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三...
  • shanzhizi
  • shanzhizi
  • 2015年03月27日 09:17
  • 893
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:关于gbk、gb2312、utf-8
举报原因:
原因补充:

(最多只允许输入30个字)