Scrapy之css选择器

最新推荐文章于 2024-04-08 16:44:58 发布

数据分析痴迷者

最新推荐文章于 2024-04-08 16:44:58 发布

阅读量473

点赞数

分类专栏： Python Scrapy 文章标签： Scrapy之css选择器

本文链接：https://blog.csdn.net/qq_21573621/article/details/90108602

版权

Python 同时被 2 个专栏收录

33 篇文章 0 订阅

订阅专栏

Scrapy

1 篇文章 0 订阅

订阅专栏

本文深入讲解了CSS选择器的使用方法，包括基本的HTML标签选择、自定义class选择，以及如何利用Scrapy框架中的response对象进行元素定位。通过具体实例演示了如何提取网页标题，并介绍了extract()与extract_first()函数的用法。

摘要由CSDN通过智能技术生成

css选择器

response.css('标签名')，标签名的话可以是html标签比如：title、body、div，也可以是你自定义的class标签。

例子

response.css('title')

##.extract() 对结果以列表的形式进行返回
##.extract_first() 对extract()返回的结果列表取第一个元素。

response.css('title').extract()
response.css('title').extract_first()

##::text以文本的方式提取
response.css('title::text').extract_first()

是使用调试命令"scrapy shell www.baidu.com进行调试

使用css选择器爬取百度标题首页