爬虫从入门到放弃(四),爬取你心目中的女神(校花网)

最新推荐文章于 2019-03-16 09:00:13 发布

置顶零zero度

最新推荐文章于 2019-03-16 09:00:13 发布

阅读量488

点赞数

分类专栏：爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38636998/article/details/85242904

版权

python 同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

本次用scrapy框架来写一个爬虫,首先那,我们要在终端创建一个scrapy项目.
命令是:scrapy startproject +项目名字
第二步,我们cd进文件夹,命令是 cd 文件名
第三步,我们要创建一个爬虫命令是:scrapy genspider +爬虫的名字 +初始化URL,这里的爬虫名字是你自己定义的,还有就是初始化URL,记得要去掉前面的http协议,如果你添加的话,你可以在你自己定义的爬虫文件中修改.
代码方面那,首先在item文件里面定义要你要爬取的内容:

在这里插入图片描述
第二步,修改自己创建的爬虫文件

第三步,写入json,修改pipelines.py

最后在settings.py里面修改一些基础配置

当然,最后的最后千万不要忘记了用:
scrapy crawl +爬虫名字来运行爬虫.
爬虫运行完毕,json文件如下
在这里插入图片描述
好了,本次就介绍到这里了,咱们下期再见

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。