[scrapy] pycharm开发scrapy - scrapy项目目录介绍

scrapy工程文件介绍

【scrapy工程文件介绍】

  • ArticleSpider
    • ArticleSpider
      • Spiders 存放具体某个网站的爬虫
        • __init__.py
        • jobbole.py 爬虫文件,使用命令scrapy genspider jobbole blog.jobbole.com生成
      • __init__.py
      • items.py 数据保存格式
      • middlewares.py 存放自己定义的middleware
      • pipelines.py数据存储
      • settings.py 设置文件
    • scrapy.cfg 配置文件

开发scrapy步骤

  1. 【创建工程与虚拟环境】创建工程与Python虚拟环境
    在这里插入图片描述

  2. 【进入虚拟环境】进入刚才创建的Python虚拟环境
    在这里插入图片描述

  3. 【安装scrapy】运行命令pip install -i https://pypi.douban.com/simple/ scrapy安装scrapy
    【提示】若中途发生失败,请手动安装失败的包https://blog.csdn.net/summer_dew/article/details/79778559#pip_96

  4. 【创建scrapy工程】:在当前目录下运行scrapy startproject ArticleSpider,新建scrapy工程(只是一个scrapy工程框架,里头没有spider的模板)
    【说明】scrapy startproject 工程名。也可以自定义模板,默认模板:"…\lib\site-packages\scrapy\templates\project"
    在这里插入图片描述

  5. 【创建spider】进入运行ArticleSpider\ArticleSpider\spiders下,运行命令scrapy genspider jobbole blog.jobbole.com,生成spider器
    【说明】scrapy genspider spider器的名称 爬取的目标域名,在当前目录下生成spider文件
    【结果】在Spiders/目录下生成了jobbole.py文件
    在这里插入图片描述

  6. 【加入刚才创建的Python虚拟环境】
    【步骤】File-> setting-> Project:ArticleSpider-> Project Interpreter-> Add-> System Interpreter-> 选择D:\mycode\CrawlerForPython\scrapy\Python3Scrapy\Scripts\python.exe

  7. 【配置工程的解释器】
    【步骤】Add Configuration --> 左上方+号 --> Python
    在这里插入图片描述

  8. 在ArticleSpider文件夹下创建main.py文件,用于scrapy调试
    【背景】 Pycharm没有scrapy的模板,实际上是没有办法调试的
    【技巧】 新建一个main.py,在文件中调用命令行
    在这里插入图片描述

# coding:utf-8
from scrapy.cmdline import execute
import sys
import os
# 设置工程路径
sys.path.append(
	os.path.dirname( #获取current_paths当前的文件夹目录
		os.path.abspath( __file__ ) #获取__file__(当前py文件)的绝对路径
	)
)
execute(["scrapy", "crawl", "jobbole"] ) #启动scrapy,相当于命令行scrapy crawl jobbole
  1. 运行该main.py文件
    【报错】ModuleNotFoundError: No module named ‘win32api’。则还需要pypiwin32模块 ,进入python虚拟环境运行:pip install -i https://pypi.douban.com/simple pypiwin32
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

geodoer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值