小知识大杂烩②

小知识大杂烩②

编码相关

注:很多文件格式和乱码问题都和编码方式相关,遇到此类问题时可以优先检查编码方式

  • ASCII
      最初的计算机编码。一般使用 7 个或 8 个二进制位进行编码,最多可以给 256 个字符分配数值。例:A 十进制码 65(0x41) ;a 十进制码 97(0x61)
  • Unicode
      将世界上所有语言的大部分常用字符都赋予了数值,但是其只是建立了字符与数值间的对应关系,并不是编码结果(常常是其他编码方式通过使用 Unicode 编码将字符转化为数值然后再编码)。
  • BOM(Byte Order Mark)
      BOM 是字节顺序标记,Unicode 规范中其是在文件开头用于标记文件存储方式是大端序还是小端序(FEFF 表示大端序,FFFE 表示小端序),也可用于标记编码方式。
  • UTF-8
      UTF-8 是最常用 UTF 编码。它是针对 Unicode 的一种可变长度字符编码,其与 7 位 ASCII 码兼容,其中的中文占 3 个字节。注意:UTF-8 不需要 BOM 来表明字节顺序,但可以使用其来表明编码方式(以 0xEFBBBF 开头)。
  • UTF-16
      UTF-16比起UTF-8,好处在于大部分字符都以固定长度的字节(2字节)储存,但UTF-16却无法兼容于ASCII编码
  • GBK
      中国国标,双字节编码方案(中文两个字节、英文一个字节 ASCII 码)。

总结

  这是我自己整理的学习笔记,主要用于自我复习。如果有大佬也看到了这个并且发现了谬误,欢迎email me at lonelytaoist@qq.com

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值