CSS选择器的使用

最新推荐文章于 2024-04-22 22:17:33 发布

MonCheri_Flowers

最新推荐文章于 2024-04-22 22:17:33 发布

阅读量428

点赞数

分类专栏：爬虫文章标签： css extract

本文链接：https://blog.csdn.net/Dimples_54/article/details/78222346

版权

爬虫专栏收录该内容

7 篇文章 0 订阅

订阅专栏

获取标题

>>> response.css(".entry-header h1").extract()
['<h1>写代码容易，编程并不容易</h1>']

>>> response.css(".entry-header h1::text").extract()
['写代码容易，编程并不容易']

获取时间

create_time = response.css("p.entry-meta-hide-on-mobile ::text").extract()[0].strip().replace("·", "")

获取点赞人数

praise_num = int(response.css(".vote-post-up h10 ::text").extract()[0])

获取收藏人数

fav_num = response.css(".bookmark-btn ::text").extract()[0]
match_re = re.match(r'.*?(\d+).*', fav_num)
if match_re:
    fav_num = match_re.group(1)

获取评论数

comments_num = response.css("a[href='#article-comment'] span::text").extract()[0]
match_re = re.match(r'.*?(\d+).*', comments_num)
if match_re:
    comments_num = match_re.group(1)
else:
    comments_num = 0

获取内容

content = response.css("div.entry").extract()[0]

获取标签

tag_list = response.css('p.entry-meta-hide-on-mobile a ::text').extract()
# 对标签进行过滤
tag_list = [element for element in tag_list if not element.strip().endswith("评论")]
tags = ",".join(tag_list)

MonCheri_Flowers

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CSS选择器的使用

获取标题>>> response.css(".entry-header h1").extract()['写代码容易，编程并不容易']>>> response.css(".entry-header h1::text").extract()['写代码容易，编程并不容易']获取时间create_time = response.css("p.entry-meta-hide-on-mob
复制链接

扫一扫