字符集与字符编码


  1. 术语

    1. 编码

      1. 将英文,汉语,符号等转化二进制数.

    2. 解码

      1. 将二进制数解析显示成英文,汉语,符号等.

      2. 解码时使用了错误的解码规则,会导致解析错误或乱码.

    3. 字符

      1. 各种文字和符号的总称.

      2. 包括各国文字,标点符号,图形符号,数字等.

    4. 字符集Charset

      1. 一个系统支持的所有抽象字符的集合.

    5. 字符编码Character Encoding

      1. 一套法则.

      2. 用于将字符转化为计算机可以接受的数字代码.

  2. 常用字符集和字符编码

    1. ASCII

      1. American Standard Code forInformation Interchange,美国信息交换标准代码

      2. 基于拉丁字母的一套电脑编码系统.

      3. 主要用于显示现代英语.

      4. 使用七位二进制表示一个字符,共有128个字符.

    2. GBXXXX

      1. 将汉字转化为计算机可以接受的数字系统的数.

      2. 每个汉字使用一个16位二进制表示,称为全角

        1. 包含两个大于8位二进制的字节

        2. 每个字符均大于127

      3. 兼容ASCII,由七位二进制组成,称为半角

      4. GB2312GB2312-80GB0

        1. 中国国家标准简体中文字符集

        2. 全称《信息交换用汉字编码字符集·基本集》

        3. 由中国国家标准总局发布,198151日实施。

        4. 通行于中国大陆;新加坡等地.

        5. 中国大陆几乎所有的中文系统和国际化的软件都支持GB2312.

        6. 包含大约7000个简体汉字

        7. 不能处理人名、古汉语等

      5. GBK

        1. GBK是对GB231080的扩展

        2. 由微软制定

        3. 非国家标准,被中国公布为“技术规范指导性文件”

        4. 包含简体中文、台湾和香港的繁体字、日语及朝鲜语汉字等。

      6. GB18030

        1. 全称:国家标准GB 180302005《信息技术中文编码字符集》

        2. 现行版本由国家质监总局和中国国家标准委员会于2005118日发布,200651日实施。为中国境内所有软件产品支持的强制规格。

        3. GB23121980完全兼容,与GBK基本兼容

        4. 支持GB13000Unicode的全部统一汉字

        5. 共收录汉字70244

        6. UTF8相同,采用多字节编码,每个字可以由1个、2个或4个字节组成。

        7. 编码空间庞大,最多可定义161万个字符。

        8. 支持中国国内少数民族的文字、繁体汉字以及日韩汉字

    3. BIG5

      1. 繁体中文社区常用。

  3. Unicode 统一码 万国码 标准万国码 单一码

    1. 伟大的创想

      1. 解决全球网络化的文字乱码问题

      2. 4个字节组成

      3. 基于通用字符集(Universal Character Set)的标准

      4. 由非营利性组织-Unicode发布

    2. UCS & UNICODE

      1. 基于ISO 10646标准字符集

    3. UTF-32

      1. 所有字符采用四个字节

    4. UTF-16

      1. 所有字符采用二个字节

    5. UTF-8

      1. 可变长度字符编码

        1. 128US-ASCII字符只需一个字节编码

        2. 带个附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母使用两个字节编码

        3. 其他基本多文种平面(BMP)中的字符(包含大部分常用字)使用三个字节编码

        4. 其他极少使用的Unicode辅助平面的字符使用四字节编码。

      2. 网络最通用

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值