什么是url encode?
url是一种资源定位符号,用于标识一个资源。url产生之初的一个想法是让url可以方便得传递,所以url的字符被限定ASCII码的一个集合内,这些被称为非限定字符集。
除此之外,还有一些字符具有特定功能,比如query参数需要?来连接url和参数。多个参数需要用&来拼接等等。这些功能性的字符被称为保留字符。
关于这些保留字符的含义,参见:https://zh.wikipedia.org/wiki/%E7%BB%9F%E4%B8%80%E8%B5%84%E6%BA%90%E6%A0%87%E5%BF%97%E7%AC%A6
里面定义了url的规范及各个保留字符的含义。
为什么需要encode?
主要有两个原因:
1.将不在非保留字符集内的字符编码为保留字符集内的。比如中文等。中文无法被直接编码至url中,需要经过encode。大致流程就是将字节流转换为对应的16进制串,再在每一个16进制前加一个百分号。
2.如果url内容包含保留字符,则也需要进行encode,比如一个query参数是abc&d,那么如果直接拼在url中,这个参数会被截断为abc。所以,url encode其实是对url中的component进行的而非url的全部。