《封号码罗》python爬虫之70行代码破解CSS映射SVG反爬虫(四)

svg映射反爬虫利用来浏览器和编程语言在渲染方面的差异,以及svgcss定位这样的前端知识。
在这里插入图片描述
不管是数字还是英文,又或者是中文,都可以使用svg映射,以达到反爬虫的策略,正如上图页面里面,d标签里面什么都没有,只有一个class属性,但是页面却可以显示出相应的内容
观察抓包情况:
在这里插入图片描述
可以看到页面加载来两个文件,分别是csssvg
在这里插入图片描述
看到css使用了background-image属性,说明它的背景是一个图片,还有下面class属性值对应使用来定位功能,可能联想一下“精灵图”的用法,需要了解的是,svg是用文本描述图像内容的矢量图像格式,所以,svg并不能算是一张真正的精灵图,它的内容是:
在这里插入图片描述
在这里插入图片描述
下面,用70行代码,破解这种csssvg映射的反爬虫策略

import requests
import re
from parsel import Selector

# 使用python代码实现自动映射,先拿到两个文件的URL
url_css = "http://www.porters.vip/confusion/css/food.css"
url_svg = "http://www.porters.vip/confusion/font/food.svg"
# 拿到需要映射的HTML标签的class属性的值
css_class_name = "vhkbvu"
# 发送请求,拿到对应的文本
css_resp = requests.get(url_css
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值