网络爬虫使用python shell分析页面

最新推荐文章于 2021-04-16 12:00:00 发布

二浩啊二浩

最新推荐文章于 2021-04-16 12:00:00 发布

阅读量174

点赞数

文章标签：爬虫 python shell 分析页面

本文链接：https://blog.csdn.net/qq_42351063/article/details/100099226

版权

以爬虫初学者训练爬虫技术的网站（http://books.toscrape.com）为例

以页面的url地址为参数运行scrapy shell 命令：

>>> scrapy shell http://books.toscrape.com

在这里插入图片描述
可以使用view(response)命令打开页面

	#提取链接
>>> from scrapy.linkextractors import LinkExtractor

	#使用CSS选择器进行选择
>>> le = LinkExtractor(restrict_css='div.image_container a[href]')
>>> links = le.extract_links(response)
>>> [link.url for link in links]

在这里插入图片描述

对其他元素进行分析同理…

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

二浩啊二浩

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
网络爬虫使用python shell分析页面

以爬虫初学者训练爬虫技术的网站（http://books.toscrape.com）为例以页面的url地址为参数运行scrapy shell 命令：>>> scrapy shell http://books.toscrape.com可以使用view(response)命令打开页面 #提取链接>>> from scrapy.linkextractor...
复制链接

扫一扫