python3之用scrapy框架项目的搭建

最新推荐文章于 2022-11-19 21:03:21 发布

find八阿哥

最新推荐文章于 2022-11-19 21:03:21 发布

阅读量89

点赞数

分类专栏：爬虫文章标签： python

本文链接：https://blog.csdn.net/wyx_001245/article/details/104421006

版权

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1 如果python3没有安装scrapy，先通过命令pip install scrapy安装

2 创建项目命令scrapy startproject xxx（xxx 为项目名）

3 用pycharm打开后

1） scrapy.cfg 为配置文件信息
2） items.py 为定义数据结构的地方
3） settings.py 为设置项目信息的文件
e.g：
    Configure maximum concurrent requests performed by Scrapy (default: 16) // 并发量 默认16
    DOWNLOAD_DELAY = 3  //下载延迟3秒
    COOKIES_ENABLED = False // 一般用于登陆后抓取数据改为true
    SPIDER_MIDDLEWARES、DOWNLOADER_MIDDLEWARES //中间件的使用

4 在项目spider目录下创建爬虫文件：
使用命令进入到项目目录下到spiders文件夹下使用命令：
scrapy genspider 文件名需要抓取到域名注：域名不需要添加双引号

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

find八阿哥

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3之用scrapy框架项目的搭建

1 如果python3没有安装scrapy，先通过命令pip install scrapy安装2 创建项目命令scrapy startproject xxx（xxx 为项目名）3 用pycharm打开后1） scrapy.cfg 为配置文件信息2） items.py 为定义数据结构的地方3） settings.py 为设置项目信息的文件e.g： Configure maxim...
复制链接

扫一扫