运行一个scrapy爬虫,更改关键字和时间还有url一起爬取

scrapy里面导入文件itens里面的函数时候,出现No module named ‘items’
解决:
在这里插入图片描述
scrapy做爬虫时,导入Module的时候总显示no module named ×××.items?可是检查很多遍都没发现什么大问题啊?

原来这是因为编译器的问题,pycharm不会将当前文件目录自动加入自己的sourse_path。

那么具体的解决方法如下:

1,找到你的scrapy项目上右键

2.然后点击make_directory as

3.最后点击sources root

4.看到文件夹编程蓝色就成功了
在这里插入图片描述

在这里插入图片描述
变成蓝色

too many values to unpack (expected 2)
在这里插入图片描述
在request里面加入headers信息,但是没有回调函数,只是在rules里面加了回调函数则出错
怎么解决?

scrapy中的Request

Request对象在爬虫程序中生成并传递到scrapy engine(引擎),直到它们到达downloader(下载器),后者执行请求并返回一个Response对象,该对象返回到发出请求的爬虫程序。
Request对象

class scrapy.http.Request(url[, callback, method=‘GET’, headers, body, cookies, meta, encoding=‘utf-8’, priority=0, dont_filter=False, errback])

1

参数:

url(string) : 请求的网址
callback(): 将使用此请求的响应(一旦下载)调用的函数作为其第一个参数。
method(string): 此请求的HTTP方法。默认为’GET’。
meta(dict) : Request.meta属性的初始值。如果给定,则此参数中传递的dict将被浅拷贝。
body(str或unicode): 请求体。不管这个参数的类型,存储的最终值将是一个str(不会是unicode或None)。
headers(dict): 请求头。dict值可以是字符串或列表。如果 None作为值传递,则不会发送HTTP头。
cookie(dict或list) - 请求cookie
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值