在编写Scrapy 时会遇到这种情况
这样在编写post时使用以下代码无法实现:
yield scrapy.FormRequest(url, method='POST',formdata ={'body':{"modelId":"%s"%model['modelId'],"catid":'%s'%catid,"orderInt":"1"},'pi':'%s'%p,'ps':'60'},callback=self.get_item,dont_filter=True)
而且formdata的数据格式要求是字符串,如果不是的话会报错;
以上代码无法返回正确的网页数据,通过以下方法可以解决(仅供参考,因为我是修改源码实现的,不明白源码为什么要这么做)
FormRequest函数的定义路径在:D:\Python27\Lib\site-packages\Scrapy-1.0.6-py2.7.egg\scrapy\http\request\form.py
打开form.py,把26行注释掉,添加27行上去就可以了
源码如下:
#querystr = _urlencode(items, self.encoding) #old code,form data for dict in dict not work
querystr = urlencode(items, doseq=0) #my modify
原因是_urlencode函数的问题,如果出现formdata的dict中的value是dict就会有问题的,所以我避免进入到该函数,避免错误,源码如下:
def _urlencode(seq, enc):
values = [(unicode_to_str(k, enc), unicode_to_str(v, enc))
for k, vs in seq
for v in (vs if hasattr(vs, '__iter__') else [vs])]
return urlencode(values, doseq=1)