编码知识整理

这篇博客详细介绍了Unicode编码与UTF-8编码的区别。Unicode是一个字符集,而UTF-8是Unicode的一种实现方式。文中通过ASCII、GBK编码对比,解释了字符编码的作用和重要性,并探讨了UTF-8的变长编码规则。此外,还讨论了在Windows环境下ANSI编码与UTF-8编码的差异,包括BOM标识符的影响。
摘要由CSDN通过智能技术生成

前言

   可能很多人事先没有了解好相关的编码知识,就把Unicode编码和UTF-8编码混为一谈相互比较,认为是两种不同的编码,其实不然,Unicoe编码只是一个字符集,规定了字符和二进制代码的对应关系,好比是一个大字典,但是对于如何编码存储在计算机及其具体实现,Unicode编码并没有做规定,而UTF-8编码就是Unicode编码的一种实现方式,它定义了解析存储的一整套编码规则,所以,就关系而言,Unicode和UTF-8编码并不能做横线比较,说到底,UTF-8编码只是实现Unicode编码的一种实现方法,并没有重新定义字符和二进制代码的二进制关系。

介绍

   Unicode编码的出现,是为了解决各个地区定义字符编码混乱而制定的一套业界标准,在Unicode编码出现之前,也出现过各式各样本土化的编码,如下所示:

编码名称 占用字节数
ASCII 一个字节
GBK 两个字节

   ASCII编码相信是大部分人最熟悉的编码之一,它是西欧编码,仅仅用一个字节表示字符,这也难怪,因为西欧大部分英文国家字符集不大,ASCII编码已经足够用了,但是到了中国,光是汉字就有几万个,ASCII编码完全不够用,所以GBK编码由此产生,使用两个字节定义一个字符,这样就可以定义六万多个字符。
   这些不同地区使用的字符编码,如果只是区域内使用,是完全没有

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值