反反爬入门——JS混淆之百度翻译!这个爬虫教程有点东西!

本文介绍了如何分析百度翻译网页,获取明显参数如query和sign。通过JS调试获取sign值,详细讲解了在Python中如何处理和使用这些参数,适合Python爬虫初学者。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、分析百度翻译网页,获取明显易得的参数

以定位到URL为前提

  1. 先作对比,找出不同的参数

  2. 从之前的请求响应中找数据 (1)网页源代码中查找 (2)全局请求搜索

可以观察到,我们输入中文时回车或者点击翻译按钮又或是不管的时候,这是会有一个结果响应,即对应的英文单词。

在XHR中我们看到了有加载的数据,我们试着在这里面找东西。

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

我们看到有个英文单词叫做transapi,这个就是有关翻译的接口了,确切来说是请求的URL。

且在这里我们看到有我们想要查询的英语单词。

 

对比form表单:

query 是自己输入的中文词

sign是动态加载的 token 可以从访问https://fanyi.baidu.com得到的静态页面中获取

 

二、js代码中获取sign值

Crt+~ 搜索框中找token看到其中有以下参数在一行中显示

点击进入之后点击左下角的{}格式化:

这边有两处,一个是自定义的函数,另一个不是,一般都是函数类的传值,如果实在不确定则两个都打上断点,刷新页面,步入函数。

 

复制完代码之后进行调试,补充完整此JS代码。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值