scrapy的安装与爬取图片

最新推荐文章于 2021-07-18 11:02:15 发布

B_Giant

最新推荐文章于 2021-07-18 11:02:15 发布

阅读量693

点赞数

分类专栏：爬虫文章标签： scrapy windows安装爬取图片图片多 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44119390/article/details/91477897

版权

爬虫专栏收录该内容

6 篇文章 1 订阅

订阅专栏

安装scrapy

今天在工作的电脑上安装scrapy，遇到了不可描述的问题，头大的很，一顿顿的伤害差点就奔溃了，不过最后还是顺利的安装成功了
最主要是windows系统，我们用的是家庭版的，不是开发版的，这个系统中缺失了一些开发工具，一般都是Twisted没有安装，下面这个网站下载，然后pip install Twisted‑19.2.1‑cp37‑cp37m‑win_amd64.whl 安装
我的python是3.7，window64位，就选择这版本下载

成功安装了Twisted
接下来准备安装scrapy受不了自己了，居然打错字，浪费了那么多的时间。
pip install Scrapy 就可以安装成功了，主要就是Twisted的安装，

那么我们开始学一些scrapy的基本操作

基本操作

创建一个scrapy项目
- cmd 文件夹里面输入命令 scrapy startproject newspider
- scrapy startproject是创建scrapy项目的固定格式，后面的minespider是你要创建的项目名称，可根据你的需求来取名，最好做到见名知意。
- 成功后的现实显示
- 接下来创建spider文件
  - 在我们第一步创建的scrapy项目中，将要创建的蜘蛛文件放在spiders文件夹下，不要问问什么，固定格式
  - 创建之前
在文件夹中输入
创建命令：
#crawl 这是模板创建名为bd 的spider文件，这里的名字不能与上面的baidu名字一样否则会出错

scrapy genspider -t crawl bd baidu.com

在这里插入图片描述

在spider文件夹中创建了新的文件bd
新的文件里面以根据文件模板创建好了基本的框架，我们直接可以使用了
看图中的注释

在这里插入图片描述

继续看图中的注释
设置请求头的时候，有些网站不支持跨域请求，需要设置’Referer’
在这里插入图片描述

图片的下载scrapy内建好的，可以直接引用管道文件
- from scrapy.pipelines.images import ImagesPipeline，这是图片的管道文件的位置，只要变成这样‘scrapy.pipelines.images.ImagesPipeline’就可以在里面使用了

在spider文件中导入from scrapy.pipelines.images import ImagesPipeline，图片管道文件

在这里插入图片描述

在这里插入图片描述
今天先讲到这里吧，讲了这么久，居然忘记讲scrapy的执行逻辑了，好尴尬，明天再捋一捋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

B_Giant CSDN认证博客专家 CSDN认证企业博客

码龄6年

94: 原创

5万+: 周排名

131万+: 总排名

12万+: 访问

: 等级

2099: 积分

64: 粉丝

85: 获赞

43: 评论

241: 收藏

私信

关注

热门文章

分类专栏

最新评论

计算机原理---除法
做而论道_CS: 学过了计算机，人就愚了。想什么事，都往歪道上想。
计算机原理---除法
做而论道_CS: 人会心算，一看就知道够不够减。机器不会，必须先做减法若余数为正，才知道够减，若余数为负，才知道不够减不够减，必须恢复原来的余数，以便再继续往下运算，这方法称为恢复余数法－－－－－－－－－－－－－你想错了。计算机中，有减法器。够减不够减，不是看余数的正负。　而是看借位是 1 是 0。另外，被除数减去除数，得到了借位和差，　也并不是立即就 “用差替换了被除数”。　　被除数依然存在，不需要你恢复余数！　　　你直接把被除数左移，就行了。　　　　差，就不要了，
计算机组成原理---运算器（一）
做而论道_CS: 关于补码，教材上都是从符号位原码取反加一开始教学。这就把你引入歧途了。取反加一，只不过是一个【障眼法】而已。实际上，补码，就是一个【代替负数】的正数。补码，与取反加一，没有半点关系。其实，任意的进制，都是有 “补码” 的。你看十进制，两位数，就是：0~99。随便算一个：27 + 99 = (一百) 26 当然也可以：27 － 1 = 26 如果你忽略进位，依然保持两位数，那么：　正数，就能当负数来用；　加法，也就能完成减法运算。如果在计算机舍弃进位，会怎样？　计算机中，就全是正数了。　负数没有了，减法运算也没有了。　减法器，当然也就用不上了。　计算机只需配置一个加法器，便可横行天下！
最新爬取QQ音乐
2201_75376745: guid在哪找到的，我找不到
selenium爬取京东商品名与价格
weixin_45617292: Traceback (most recent call last): File "C:/Users/F-1/PycharmProjects/untitled/抓价格.py", line 11, in <module> kw = Browner.find_element_by_id("key") AttributeError: 'WebDriver' object has no attribute 'find_element_by_id'

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。