Scrapy 学习笔记（一）

最新推荐文章于 2024-05-24 15:17:49 发布

Blancky

最新推荐文章于 2024-05-24 15:17:49 发布

阅读量159

点赞数

分类专栏：爬虫文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/blancky/article/details/106269232

版权

爬虫专栏收录该内容

0 篇文章 0 订阅

订阅专栏

## 安装Scrapy 框架

1.安装'scrapy'：通过`pip install scrapy`即可安装。

2.如果在Windows安装，则还需要安装`pypiwin32`，安装方式为`pip install pypiwin32`。

3.如果在Ubuntu安装，则需要安装一些第三方库：`sudo apt-get install python-dev python-pip libxml12-dev libxslt1-dev zliblg-dev libffi-dev libssl-dev`。

##Scrapy框架结构

##创建项目和爬虫

1.创建项目：`scrapy startproject [项目名称]`。

scrapy startproject test

2.创建爬虫：进入到项目所在路径，执行命令：`scrapy genspider [爬虫名称] [网页路径]`。

cd test
scrapy genspider test_spider "www.bilibili.com"

注意，项目名称和爬虫名称不能相同。

##项目目录结构

1.items.py ：用来存放爬虫爬取下来数据的模型。

2.middlewares.py ：用来存放各种中间件的文件。

3.pipelines.py ：用来将items的模型存储到本地磁盘中。

4.settings.py ：本爬虫的一些配置信息，（例如请求头、多久发一次请求、ip代理池等）

5.scrapy.cfg：项目的配置文件。

6.spiders包：所有爬虫存放的位置。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scrapy 学习笔记（一）

##安装Scrapy 框架1.安装'scrapy'：通过`pip install scrapy`即可安装。2.如果在Windows安装，则还需要安装`pypiwin32`，安装方式为`pip install pypiwin32`。3.如果在Ubuntu安装，则需要安装一些第三方库：`sudo apt-get install python-dev python-pip libxml12-dev libxslt1-dev zliblg-dev libffi-dev libssl-dev`。##.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。