- 博客(2)
- 收藏
- 关注
原创 分享爬取豆瓣评论(多页)的思路和代码
我们在span标签查找有allstar字符串的内容,同时我们发现有很多用户可能没有评分,所以我们只处理有评分的,由于豆瓣网显示0-5星,但是数值为0-50,所以我们先将数字从字符串提取出来,然后除以10就得到了结果,然后我们使用定义的列表存储上述三个值,这样每一页的数据就爬取好了。此处user_name = comment.find('a', class_='name').get_text()是简单的提取文本,content同理,就是星级需要处理,"用户名":user_name,"星级":star,
2024-05-22 17:03:56 1020 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人