GBK、UTF-8等常用的编码格式的编码以及解码(上)

首先来简单介绍一下常用的编码格式
*ASCII
计算机刚出来的时候,ASCII也由此诞生了,它是由美国编写的,采用的是单字节的编码方式,其包含了大小写英文字母以及一些常用的符号等。
ISO8859-1
ISO8859-1是扩展ASCII的,向下兼容ASCII,同时它也是采用单字节的编码方式,它支持大多数的欧洲国家的语言,比如,德国、法国、意大利语、拉丁语等,其中没有加入欧元符号,后来欧元符号加入了ISO8859-15。
GB2312
这是由我国编写的,用来支持汉字的编写,其数字、字母采用单字节,简体汉字采用两个字节。
GBK
GBK大大的扩展了gb2312,加入了大量的字符,比如繁体字,gb2312中没有的简体汉字等,GBK比GB2312更加的全面。
UNICODE
每个国家都使用自己本国的语言编码,比如中国使用GBK、韩国使用EUC_KR、欧洲使用ISO等等,这就造成了各种编码的不兼容,出现乱码之类的。于是UNICODE应运而生了,它是国际编码,把各国的每个字符都编写进去了,其通常是使用两个字节表示一个字符。
UTF-8
UTF-8其是UNICODE的一种实现,它采用的是可变长的编码方式,用1~6个字节表示Unicode符号,比如英文字母用一个字节表示,简体汉字用三个字节表示,其优点是比较的灵活,效率相对于UTF-16来说比较的低。
UTF-16
UTF-16采用固定长度的编码方式,每两个字节表示一个Unicode字符,其优点是比较简单、效率比较的高,缺点也比较明显,增大了存储空间。
编码以及解码
编码:其实是字符转变为字节
解码:字节转变为字符

下一篇是一些简单代码的实现

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值