其实在以前就盯上 有道翻译了
的,但是由于时间问题一直没有研究(我的 骚操作还在后面 ,记得关注),本文主要讲解如何用python调用有道翻译,讲解 这个爬虫与有道翻译 的js“ 斗争
”的过程!
分析
对于一个网站,首先肯定要的就是分析,分析其中的网页规则
分析url
进入有道翻译你会发现它的url是没有变化的,也就是说它的请求是通过ajax异步交互的。点击F12,很容易在 XHR 中找到这个交互的请求,点击查看信息,你会发现一串参数,其中有几个还是加密了的,啥salt盐啥的。先有个数。
分析参数01
可以大胆猜测:这个关键参数肯定在一块。我们搜索 salt
,然后正常的点击,格式化展开,在js中再次搜索 salt
。想找相关salt附近看看 能不能找到断点 进行调试!当然,最终你可以找到11个相关内容可以在每个附近进行断点调试。你这样乐意找到相关位置关键加密字段和函数。
在这里插入图片描述