Scrapy FormRequest formdata 中dict value是dict情况解决方法

最新推荐文章于 2022-05-01 18:30:48 发布

yingmutongxue

最新推荐文章于 2022-05-01 18:30:48 发布

阅读量3.4k

点赞数

文章标签： python Scrapy formda

本文链接：https://blog.csdn.net/yingmutongxue/article/details/52733045

版权

在编写Scrapy 时会遇到这种情况

这样在编写post时使用以下代码无法实现：

yield scrapy.FormRequest(url, method='POST',formdata ={'body':{"modelId":"%s"%model['modelId'],"catid":'%s'%catid,"orderInt":"1"},'pi':'%s'%p,'ps':'60'},callback=self.get_item,dont_filter=True)

而且formdata的数据格式要求是字符串，如果不是的话会报错；

以上代码无法返回正确的网页数据，通过以下方法可以解决（仅供参考，因为我是修改源码实现的，不明白源码为什么要这么做）

FormRequest函数的定义路径在：D:\Python27\Lib\site-packages\Scrapy-1.0.6-py2.7.egg\scrapy\http\request\form.py

打开form.py，把26行注释掉，添加27行上去就可以了

源码如下：

#querystr = _urlencode(items, self.encoding) #old code,form data for dict in dict not work
querystr = urlencode(items, doseq=0) #my modify

原因是_urlencode函数的问题，如果出现formdata的dict中的value是dict就会有问题的，所以我避免进入到该函数，避免错误，源码如下：

def _urlencode(seq, enc):
    values = [(unicode_to_str(k, enc), unicode_to_str(v, enc))
              for k, vs in seq
              for v in (vs if hasattr(vs, '__iter__') else [vs])]
    return urlencode(values, doseq=1)

原创，转载请注明出处：yingmutongxue的博客：http://blog.csdn.net/yingmutongxue/article/details/52733045