编码格式与系统位数

大家在接收别人文件是应该都有碰到过乱码的情况,这个时候需要做的是讲文件编码格式进行切换成别人使用的编码格式就可以看到原来的文件里写的是什么。
摘要由CSDN通过智能技术生成

一:编码

大家在接收别人文件是应该都有碰到过乱码的情况,这个时候需要做的是讲文件编码格式进行切换成别人使用的编码格式就可以看到原来的文件里写的是什么。

ASCII格式

​ ASCII格式这个编码是指0-127的内容,0x20以下的字节状态是控制码,用来控制一些输入和输出比如换行等情况,后面就包含了空格,标定符号,数字和大小写字母等这些扩充到127号。

非ASCII编码

​ 英语使用128个字符能够满足条件,但是其他语言不能满足,就会使用最高位参与编码。将这个扩充到256个符号编码。比如GB2312编码

Unicode

​ Unicode就像是一个集合,统一编码,统一所有的字符集合,这个包含了100多万个符号。

每种编码中一个字符所占的字节数

在ASSIC码中  每一个字符统一都需要8个bit来存储
一位=1bit;1个字节=1bytes=8bit
在Unicode 万国码中 每一个字符统一占两个字节即16个bit
支持中文的第一张表叫做 GB2312 (1980 gb2312 6700+个中文;1995 gbk1.0 20000个中文;2000 gb18030 27000个中文 ;big5 台湾)
UTF-8 = unicode 的扩展集,可变长的字符编码集 在UTF-8中一个字符占3个字节

  1. GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值