你需要了解的编码知识

字符编码介绍

ASCII

    全称:美国信息交换标准代码
    简称:ASCII
    大小:1字节
    作用:显示现代英语和其他西欧语言
    性质:编码方式
    介绍:

    ASCII是由美国国家标准学会制定的标准的单字节字符编码方案,目的是形成美国通用的信息交换标准,实现计算机二进制数到常用符号的映射关系。
    ASCII码是单字节大小,我们知道1Byte = 8 bit,即一个字节由8位二进制数组成,ASCII拥有的可映射空间为2^8=256,ASCII码表示就是使用7位或8位二进制数组合来表示128或256种可能的字符。
    7位二进制数组合------标准ASCII码
    8位二进制数组合------扩展ASCII码

    码表:

    ASCII码(128) = 通用控制字符(32) + 十进制数码(10) + 英文大小写字母(52) + 专用符号(34)

Unicode

    全称:万国码、国际码、统一码、单一码
    简称:Unicode
    大小:任意
    作用:通用字符编码方案
    性质:编码方式
    介绍:

    Unicode是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。

    码表:

    Unicode编码空间共划分为17个平面,每个平面包含2^16 = 65536个码位,0号空间叫做基本多文种平面,其他平面叫做补充平面

UTF-8

    全称:可变长度字符编码
    简称:8位元
    大小:1~4字节
    作用:全世界所有国家需要用的字符
    性质:存储方式
    介绍:

    UTF-8是Unicode的一种实现方式,它是一种变长的编码方式,使用1~4个字节来表示一个符号,根据不同的符号而变化字节长度。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。

GBK

    全称:汉字编码字符集
    简称:GBK
    大小:2字节
    作用:中文编码
    性质:存储方式
    介绍:

    GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8的占用比GBK大。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值