编码及字符集概括

  • ASCII
    长度一个字节,不包括中文

  • GBK
    和GB2312, GB18030等同族。
    单双字节变长编码;高字节>127代表连续的两个字节表汉字,单字节与ASCII相同。

  • ANSI
    ASCII无法满足基本需求的国家和区域的自有编码统称ANSI,如果是Windows简体中文版ANSI可能使用GB2312,繁体操作系统可能是BIG5。

  • Unicode
    将世界上绝大多数国家的文字、符号都编入其中的字符集。
    通常为两个字节,如果直接使用较耗带宽和硬盘。

  • UTF——Unicode的实现(存储)方式

    • UTF-8
      最广泛的使用的 UTF 方案
      可变长度(1~6)字节来储存 Unicode 字符
      UTF-8编码规则
    • UTF-16
      两字节
    • UTF-32
      四字节

    BOM文件编码头,它是插入到以UTF-8、UTF16或UTF-32编码文件开头的特殊标记,用来识别文件的编码类型。对于UTF-8来说,BOM标记的有无并不是必须的。

在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值