编码种类
1.ASCII
只有英文字符与阿拉伯数字与其他字符
计算机只能处理数字,所以当需要处理文本时需要将数字转换为数字,最开始以一字节表达一个字符。一字节是8位,所以最开始的ASCLL编码是255个字符
2.Unicode
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。
Unicode将各国文字编码为16进制数表示
- utf-8
- utf-16
- utf-32
这三种就是Unicode的二进制编码模式
3.UCS(ISO 10646)
是国际标准化组织iso开展的 ISO/IEC 10646项目,名字叫“ Universal Multiple-Octet Coded Character Set”,简称UCS。
内容与Unicode基本相同
4.GBK是GB2312过度到UCS的中间产物
常用编码方式
1.浏览器的默认编码,解码是 GB2312
2.http消息的传递,编码模式由content-type控制
遇见的编码坑
1.c语言的编码模式为gb2312,当使用c语言发送http消息时候,注意解码方式
2.支付宝的回调消息编码模式为utf-8,验证签名时候要注意设置charset