HTTP请求中的URL编码是为了解决特殊字符在URL中的传输问题。URL编码使用百分号 (%) 后跟两个十六进制数字来表示特殊字符的ASCII码。
例如,%E2 表示的是十六进制的编码,对应的ASCII码是 226。这种编码方式可确保URL中的特殊字符不会被误解为URL的一部分,而是作为传输数据的特殊字符进行处理。
假设请求的资源为:
http://192.168.200.129:10000/你好/游戏.jpg
则服务器端实际收到的为:
http://192.168.200.129:10000/%E4%BD%A0%E5%A5%BD/%E6%B8%B8%E6%88%8F.jpg
要将URL编码转为中文,可以使用URL解码的方法,即将%后跟两位十六进制数字的编码转换为对应的字符。由于UTF-8编码中,一个中文字符通常由三个字节表示,所以在URL编码时会产生三个十六进制的转码。
例如,在UTF-8编码中,汉字 "中" 的编码是 "E4 B8 AD",它会被URL编码为 "%E4%B8%AD"。这里的 %E4 对应十六进制的 "E4",%B8 对应 "B8",%AD 对应 "AD"。这三个十六进制的转码组合在一起表示了一个中文字符。
C语言解码代码示例:
int hexToDec(char c)
{
if(c >= '0' && c <= '9')
return c-'0';
if(c >= 'a' && c <= 'z')
return c-'a'+10;
if(c >= 'A' && c <= 'Z')
return c-'A'+10;
return 0;
}
void DecodeMsg(char *from, char *to)
{
for(;from[0] != '\0';from++,to++)
{
//printf("from[0]=%c\n",from[0]);
if(from[0] == '%' && from[1]!='\0' && from[2]!='\0')
{
to[0]=hexToDec(from[1])*16+hexToDec(from[2]); //检测到%E2%A1这一类的编码则转为中文
from=from+2;
}
else
{
to[0]=from[0];
}
}
to[0]=from[0];
}
//调用方法
DecodeMsg(path,path);