大众点评反爬虫简单研究之一

这篇博客探讨了大众点评如何使用字体库作为反爬虫手段,通过Unicode编码替换文字,并提到每次请求的字体文件可能不同,为爬取数据增加了挑战。作者建议通过整理woff文件中的Unicode来应对这一策略。
摘要由CSDN通过智能技术生成

前言

前几天因为要和大学同学聚会,所以看了一下大众点评。在刷一家餐厅的点评时看到了一个厨师的名字,就好奇这是谁,然后就复制名字准备去搜一下。点评做了防复制,当然直接用浏览器开发者工具或者查看源代码可破。就在用浏览器开发者工具的时候,发现了部分字被替换成了<svgmtsi>标签,猜测是作为一种反爬虫的手段,就稍做研究了一下。

分析

通过Chrome开发者工具可以看到,部分字被替换成了类似于下列的代码:

<svgmtsi class="review"></svgmtsi>

在审查元素中出现,可以在网页源代码中看到对应的Unicode编码。

<
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值