Scrapy教程(一)爬取豆瓣top250电影

最新推荐文章于 2021-07-05 20:08:30 发布

小强的呼呼呼

最新推荐文章于 2021-07-05 20:08:30 发布

阅读量1.3k

点赞数

分类专栏：爬虫文章标签：爬虫

本文链接：https://blog.csdn.net/u010814042/article/details/74127309

版权

本文是学习Scrapy的实践项目，介绍如何爬取豆瓣Top250电影的名称、导演和评分。通过创建初始爬虫项目，修改item.py和设置，以及编写spiders文件夹下的爬虫代码，最终成功运行爬虫并展示爬取结果。

摘要由CSDN通过智能技术生成

一、介绍

个人最近学习scrapy的一个练手项目，因为是爬取静态网页比较简单，不过还是基本熟悉了用scrapy进行爬虫的流程。爬取的是豆瓣top250的电影名称，导演，评分等。

二、代码解析

首先创建初始爬虫项目, cd到想保存的目录，然后在命令行中输入
```
$ scrapy startproject top250
```

然后我们开始更改item.py文件，代码如下

import scrapy

class Top250Item(scrapy.Item):
    movie_name = scrapy.Field()
    director = scrapy.Field()
    actor = scrapy.Field()
    type = scrapy.Field()
    score = scrapy.Field()

pipeline不用修改

最低0.47元/天解锁文章

小强的呼呼呼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scrapy教程(一)爬取豆瓣top250电影

一、介绍个人最近学习scrapy的一个练手项目，因为是爬取静态网页比较简单，不过还是基本熟悉了用scrapy进行爬虫的流程。爬取的是豆瓣top250的电影名称，导演，评分等。二、代码解析首先创建初始爬虫项目, cd到想保存的目录，然后在命令行中输入$ scrapy startproject top250然后我们开始更改item.py文件，代码如下import scrapyclass Top250
复制链接

扫一扫

专栏目录