一、实验出现的问题
1)在查询参数中包含中文
出现了\u4f60这样不可识别的字符(unicode编码)
出现了\u4f60和%E4%BD这样不可识别的字符(unicode编码)
2)在请求头中包含中文
接口运行出错:‘ascii’ codec can’t encode…
3)在请求体中包含中文(JSON类型)
应答体JSON出现了\u4f60这样的不可识别的字符
4)在请求体中包含中文(TEXT类型)
接口运行出错:‘latin-1’ codec can’t encode…
5)在请求体中包含中文(FORM类型)
出现了\u4f60这样的不可识别的字符(unicode编码)
二、编码问题的基础知识
1)字符
字符的现象:a、1、*、&、好、の
字符的本质?数值!
字母+数字+制表符+控制字符=ASCII(字符集)
字符的显示:渲染
2)字符集
1、ASCII
0-127
2、GB2312(大约7千字)/GBK(2W)/GB18030(7W)
ASCII+中文字符、中文符号
byte:8bit;0-255
3、欧洲&#x