(1) 在运行下面的代码时,服务器返回 Method Not Allowed,由于对于构造Request时,第二个参数不清楚写什么,因而随便写了个值,对于许多网站,这都没有问题,但对于代码中的网站缺异常了。
# create a request
url="http://www.dy2018.com/"
user_agent="Mozilla/5.0 (Windows NT 5.1; rv:44.0) Gecko/20100101 Firefox/44.0"
ref="http://www.dy2018.com/"
values={}
data=urllib.urlencode(values)
headers={'User-Agent':user_agent,'Referer':ref}
request=urllib2.Request(url,data,headers)
# build a connection and send the request,then get the response
try:
response=urllib2.urlopen(request)
except urllib2.URLError, e:
print e.reason
else:
# show response
print response.read()
既然怀疑问题出在这里,则将代码修改为:
request=urllib2.Request(url)
删除第二个和第三个参数后,可以正常获取到内容了。不要随便传递POST data参数!!
此外,在CSDN上搜到一篇文章,对此错误有比较详细的介绍: HTTP 405 错误--Method not allowed
(2) 修改上述代码如下,再次运行,服务器返回: Forbidden
# create a request
url="http://xueqiu.com/"
user_agent="Mozilla/5.0 (Windows NT 5.1; rv:44.0) Gecko/20100101 Firefox/44.0"
ref="http://www.dy2018.com/"
values={}
data=urllib.urlencode(values)
headers={'User-Agent':user_agent}
request=urllib2.Request(url)
根据以前的经验,因为header验证不过导致,因而修改代码为:
request=urllib2.Request(url,data,headers)
然而服务器却返回错误:
Not Found
怀疑data出问题,进而修改代码如下:
request=urllib2.Request(url,headers=headers)
不要随便传递POST data参数!!
最后,对于参数带有默认值的函数,在调用它时,对其参数的赋值是灵活多样的,仅仅赋值没有默认值的可以;参数顺序改变也可以。