爬虫——headers中的神坑

1、Content-Length:
        最好在headers中不要加这个字段,通过工具测试是好好的,一写入爬虫就报错:(failed 1 times): 400 Bad Request。一个下午找不到哪里错了,吐血。。。。。

2、"Content-Type": "application/x-www-form-urlencoded"
         这里就不得不提chrom(按F12)中的query string parameters 和 from data,正常的post参数对应query string parameters;当"Content-Type"被设置成"application/x-www-form-urlencoded"时候,表单的请求参数就会被隐藏,不会再url中显现出来,此时的参数就在from data中。
        以下是两种post请求方法:
a、FormRequest(url,callback=self.parse,formdata=formdata,headers={"Content-Type": "application/x-www-form-urlencoded"})
b、Request(url, method="POST", body=json.dumps(formdata), headers={'Content-Type': 'application/x-www-form-urlencoded'}, callback=self.parse)

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值