get请求
我们都知道在上传表单的时候,有两种方法:
post和get方式
其中
post方法是加密传输的
get方法是明码传输
下面说说get方法
当在搜索框搜索一个中文字符时,会加密显示在地址栏中:
比如我在百度中搜索“中国”
地址栏是这样的
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=80035161_1_dg&wd=%E4%B8%AD%E5%9B%BD&fenlei=256&oq=%2526lt%253BSDN&rsv_pq=8442d3e6001c6573&rsv_t=e5e6Mw274XLa5z%2B06IY8YFvCDAIMj%2Bsr1mjEDav078ZuE35YCR5S2iDjyGItaVlFH9cb2Q&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_btype=t&inputT=3170&rsv_sug3=37&rsv_sug1=34&rsv_sug7=101&rsv_sug2=0&rsv_sug4=3171
这时看wd的值是一串字符:
%E4%B8%AD%E5%9B%BD
而当在搜索栏中输入Crawler时,wd显示的就是原英文
这是因为
中文会使用编码的方式进行加密传参
那么我们如何能够知道某一个中文词条对应的编码呢?
看代码:
import urllib
dic = {"wd":"中国"}
china = urllib.parse.urlencode(dic)
print(china)
的到结果:
wd=%E4%B8%AD%E5%9B%BD