爬虫-大众点评评论信息(思路)

本文介绍了如何使用Python爬虫抓取和解析大众点评评论信息。通过CSS映射,发现评论中的部分字体是SVG背景图。通过分析CSS文件,找到映射文件和字体文件,提取X、Y坐标,结合字体大小和行间距,计算出加密字符对应的文本内容。
摘要由CSDN通过智能技术生成

Python爬虫-爬取大众点评评论信息(CSS映射)

正常页面显示数据为:
在这里插入图片描述

而打开开发者工具每条评论的个别字是通过标签替换的

在这里插入图片描述

部分字体被svgmtsi标签包含,实际上是一张svg背景图,通过类选择器进行CSS映射
在这里插入图片描述

所以下一步,查找CSS文件,直接右击查看源代码,Ctrl+f查找.css文件,可以查找到4个文件

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6mA6mcy7-1608714288717)(C:\Users\lili\AppData\Roaming\Typora\typora-user-images\1608692395509.png)]

通过分析每个css文件的内容,实际可以得出第二个文件是css映射的文件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值