python scrapy学习笔记(一)

这是一个用来记录我学习scrapy的自用笔记


新建项目

命令:

    scrapy startproject articleScrapy  #创建一个新的articleScrapy

    scrapy genspider movie https://www.80s.tw./movie/list/----g #创建爬取的py domain


调试:

    跟目录下新建文件main.py 在里面调用命令行方便调试

    main.py

    

    之后在调试的过程中只需要运行main文件即可(运行过程中windows可能会报错提示缺少win32api,so you need 'pip install -i https://pypi.douban.com/simple pypiwin32'),这时候运行main按道理正常且在movie.py文件中打断点后response会有数据返回;

    警告:

    在settings.py下

 这里默认一般是True要改为False如果设置为True的时候scrapy会默认去读取每个网站上的robots协议,如果不满足的url会过滤掉,爬虫很快就会结束;


    


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值