Scrapy教程(一)爬取豆瓣top250电影

本文是学习Scrapy的实践项目,介绍如何爬取豆瓣Top250电影的名称、导演和评分。通过创建初始爬虫项目,修改item.py和设置,以及编写spiders文件夹下的爬虫代码,最终成功运行爬虫并展示爬取结果。
摘要由CSDN通过智能技术生成

一、介绍

个人最近学习scrapy的一个练手项目,因为是爬取静态网页比较简单,不过还是基本熟悉了用scrapy进行爬虫的流程。爬取的是豆瓣top250的电影名称,导演,评分等。

二、代码解析

  1. 首先创建初始爬虫项目, cd到想保存的目录,然后在命令行中输入

    $ scrapy startproject top250
  2. 然后我们开始更改item.py文件,代码如下

    import scrapy
    
    class Top250Item(scrapy.Item):
        movie_name = scrapy.Field()
        director = scrapy.Field()
        actor = scrapy.Field()
        type = scrapy.Field()
        score = scrapy.Field()
  3. pipeline不用修改

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值