字符编码中utf-8与gb2312

在写页面的时候,常常遇到字符编码的问题,纠结于 utf-8或是gb2312,也就是charset属性。(如果外部文件中的字符编码与主文件的编码方式不同,那我们就要用到charset属性。)

你比如说php文件本身就是必须是utf-8编码,输出头header("Content-Type: text/html; charset=utf-8");PHP连接mysql数据库时,MYSQL数据库字符编码也是utf-8。

来看下常见字符编码的一些解释

UTF编码:俗称万国码,致力于使用统一的编码准则表达各国的文字。
为表达更多的文字,utf-8采用2/3混编的方式。目前容纳的汉字范围小于gbk编码。它也叫unicode编码。

GB2312编码:大约包含6000多汉字(不包括特殊字符),编码范围为第一位b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和其他字符大约7573个字符编码

gbk编码:是对gb2312编码的扩充,容纳的汉字更多,但仅仅是扩充,没有质的变化。保留了所有gb2312编码,在此基础上进行编码范围的扩充.容纳(包含特殊字符)共22014个字符编码.

总结

GB2312编码只适合中文网站,UTF-8是国际通用的标准,网站语言可以是其他各国语言,只是中文字符不及GB2312详;可以这样想,UTF-8包括了GB2312。所以字符编码的设置还是要看你网站的受众。



  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值