pycharm运行scrapy项目

pycharm运行scrapy项目

刚学scrapy,之前都是在命令行运行scrapy项目,但是据说用pycharm可以debugger,想试试,但会出问题,下面是我看了网上解决方法之后总结的我觉的较好的解决方法


配置过程

首先在项目文件和scrapy.cfg同一级别目录下新建一个main.py

main.py

# -*— coding: UTF-8 -*-
from scrapy.cmdline import execute
import sys
import os

# 打断点调试py文件
# sys.path.append('D:PyCharmpy_scrapyjobbole')
sys.path.append(os.path.dirname(os.path.abspath(__file__)))
print(os.path.dirname(os.path.abspath(__file__)))
execute(['scrapy', 'crawl', 'tianmao'])

注意

execute的第三个参数tianmao是你spider文件下执行爬取的py文件里属性name的值


下一步将setting.py文件里的机器三定律改成false(最好都改成false,这样就可以爬更多网页了)

# Obey robots.txt rules
# 遵守机器人。三种规则
ROBOTSTXT_OBEY = False

接下来最重要的是看你spider文件下的爬取文件spider.py有没有代码错误,像我之前就是start_urls 写成start_url了,导致debugger的时候一直以为是其他错误,一直进不了爬取操作代码

接下来就是执行运行scrapy项目了,打开main.py文件,右键

这里写图片描述

就可以看到Run和Debug这两个选项,这时候你就能感受到这个IDE的好处了,毕竟用命令来查询还是蛮麻烦的

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值