Scrapy命令 和 User Agent

Scrapy 命令


全局命令

startproject 新建工程
settings 配置文件
genspider 新建spider
bench 测试命令
runspider
shell
fetch 使用Scrapy下载器(downloader)下载给定的URL,并将获取到的内容送到标准输出。
view 在浏览器中打开给定的URL,并以Scrapy spider获取到的形式展现。
version scrapy的版本信息

项目命令

crawl 执行spider
check 检查spider
list 列出当前项目中可用的spider
edit
parse 获取给定的URL并使用相应的spider分析处理

常用操作

新建工程:scrapy startproject XXX

新建spider:scrapy genspider XXX “XXX.XXX.XX”

执行spider:scrapy crawl XXX

检查spider:scrapy check XXX

列出当前项目中可用的spider:scrapy list

shell命令

Scrapy shell 是一个交互式的shell,Scrapy shell对于开发爬虫是非常好用的一个测试工具。他可以在未启动spider的情况下尝试及调试爬虫代码。

shelp() - 打印可用对象及快捷命令的帮助列表

fetch(request_or_url) - 根据给定的请求(request)或URL获取一个新的response,并更新相关的对象。

view(response) - 在本机的浏览器打开给定的response。 其会在response的body中添加一个 tag ,使得外部链接(例如图片及css)能正确显示。

在spider中启用shell来查看response

通过 scrapy.shell.inspect_response 函数来实现:

import scrapy
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值