为什么要采用UTF-8编码(转载)

原创 2004年12月30日 19:59:00
  前不久有个网友问我说修改L-Blog时老是出现乱码,好像和其他的中文编码不一样,我说因为采用了UTF-8编码。现在大多数程序(BBS|Blog)都是基于GB2312编码的,但是为什么要改用兼容性不好(容易乱码)的UTF-8呢?开始我也不了解,直到我看了Zola的这片文章才有所了解:


中文有三种字符集,统一文字的编码将是进一步交流的基础。

·国内网站和BLOG较多使用简体中文编码GB2312 字符集;
·港澳台地区网站和部落格使用繁体中文网页编码BIG5字符集;
·UTF-8 包含了简体和繁体中文字符,能正确显示多种语言文字.

统一编码带来的交流便利将在trackback等功能上体现出。

UTF-8格式编码与UTF-8无BOM格式编码的区别(包括java文件)

BOM——Byte Order Mark,就是字节序标记 在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字...
  • fhzaitian
  • fhzaitian
  • 2016年05月25日 09:07
  • 4382

utf8编码原理详解

很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们认为8个开关状态作为原子单位很好,于是他们把这称为"字节"。 再后来,他们又做了一些可以处理这些...
  • baixiaoshi
  • baixiaoshi
  • 2014年11月04日 16:10
  • 10922

MUTF-8编码格式介绍

在Android应用程序的Dex文件中,所有的字符串都是使用一种叫做MUTF-8(Modified UTF-8)的编码格式进行编码的。 所谓的MUTF-8编码,其实是对UTF-16字符编码的再编码。 ...
  • Roland_Sun
  • Roland_Sun
  • 2015年07月01日 23:29
  • 1987

Ansi编码和UTF-8编码

原文地址:http://www.yanwushu.com/post/4.html 1.  ANSI指American National Standards Institute(美国国家标准学会)。...
  • yanwushu
  • yanwushu
  • 2015年04月09日 15:44
  • 1408

[置顶] java 中文字符串,utf-8编码为byte数组的计算过程

背景:  对于编码解码的计算过程一直没有去研究过。以前也看了大神写的编码解码的文章,当时看了似懂非懂,没有仔细去品味,没去实践。正应了那句老话:纸上得来终觉浅,绝知此事要躬行。  为什么有编码和解...
  • liuwenjie517333813
  • liuwenjie517333813
  • 2017年03月29日 10:37
  • 1477

在MyEclipse中把JSP默认编码改为UTF-8

在MyEclispe中创建Jsp页面,Jsp页面的默认编码是“ISO-8859-1”,如下图所示: 在这种编码下编写中文是没有办法保存Jsp页面的,会出现如下的错误提示: ...
  • qhwc2009
  • qhwc2009
  • 2015年04月22日 22:46
  • 897

UTF-8 可变编码格式

UTF-8 是一种可变编码格式,长度从一个字节到四个字节,可根据UTF-8字符的第一个字节来识别一个UTF-8字符的长度(具体见下面描述). 因为网络中大部分的字符是ASCII码字符,UTF-8可以用...
  • swedenfeng
  • swedenfeng
  • 2016年12月05日 17:51
  • 333

汉字UTF8编码占用几个字节

点击打开链接http://en.wikipedia.org/wiki/UTF-8#Description This table shows UTF-8 as it is since 2003 (th...
  • lein_wang
  • lein_wang
  • 2017年01月10日 16:35
  • 489

JSP使用UTF-8链接MYSQL数据库(UTF8)乱码以及连接失败问题以及更改mysql默认编码

JSP使用UTF-8链接MYSQL数据库(UTF8)乱码以及连接失败问题: 前言,服了这些大公司,做的数据库都不人性化。。。我忙了很久才搞定的说 1.在mysql的数据库是utf8编码的时候,连...
  • huitoukest
  • huitoukest
  • 2014年06月01日 10:19
  • 1519

UTF-8汉字编码16进制对照---转载

GB    Unicode  UTF-8  Chinese Character D2BB  4E00  E4 B8 80  一 B6A1  4E01  E4 B8 81  丁 C...
  • u012484316
  • u012484316
  • 2013年12月20日 00:20
  • 4524
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:为什么要采用UTF-8编码(转载)
举报原因:
原因补充:

(最多只允许输入30个字)