运行一个scrapy爬虫，更改关键字和时间还有url一起爬取

最新推荐文章于 2022-06-19 01:58:25 发布

weixin_43689344

最新推荐文章于 2022-06-19 01:58:25 发布

阅读量285

点赞数

分类专栏：数据挖掘文章标签：更改关键字还有url 一起爬取

本文链接：https://blog.csdn.net/weixin_43689344/article/details/94622300

版权

数据挖掘专栏收录该内容

10 篇文章 1 订阅

订阅专栏

scrapy里面导入文件itens里面的函数时候，出现No module named ‘items’
解决：
在这里插入图片描述
scrapy做爬虫时，导入Module的时候总显示no module named ×××.items？可是检查很多遍都没发现什么大问题啊？

原来这是因为编译器的问题，pycharm不会将当前文件目录自动加入自己的sourse_path。

那么具体的解决方法如下：

1,找到你的scrapy项目上右键

2.然后点击make_directory as

3.最后点击sources root

4.看到文件夹编程蓝色就成功了
在这里插入图片描述

在这里插入图片描述
变成蓝色

too many values to unpack (expected 2)
在这里插入图片描述
在request里面加入headers信息，但是没有回调函数，只是在rules里面加了回调函数则出错
怎么解决？

scrapy中的Request

Request对象在爬虫程序中生成并传递到scrapy engine（引擎），直到它们到达downloader（下载器），后者执行请求并返回一个Response对象，该对象返回到发出请求的爬虫程序。
Request对象

class scrapy.http.Request(url[, callback, method=‘GET’, headers, body, cookies, meta, encoding=‘utf-8’, priority=0, dont_filter=False, errback])

参数：

url(string) : 请求的网址
callback（）: 将使用此请求的响应（一旦下载）调用的函数作为其第一个参数。
method（string）: 此请求的HTTP方法。默认为’GET’。
meta（dict） : Request.meta属性的初始值。如果给定，则此参数中传递的dict将被浅拷贝。
body（str或unicode）： 请求体。不管这个参数的类型，存储的最终值将是一个str（不会是unicode或None）。
headers（dict）： 请求头。dict值可以是字符串或列表。如果 None作为值传递，则不会发送HTTP头。
cookie（dict或list） - 请求cookie

weixin_43689344

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
运行一个scrapy爬虫，更改关键字和时间还有url一起爬取

scrapy里面导入文件itens里面的函数时候，出现No module named ‘items’解决：scrapy做爬虫时，导入Module的时候总显示no module named ×××.items？可是检查很多遍都没发现什么大问题啊？原来这是因为编译器的问题，pycharm不会将当前文件目录自动加入自己的sourse_path。那么具体的解决方法如下：1,找到你的scrapy...
复制链接

扫一扫

专栏目录