前言
今天教大家如何利用 firefox 分析百度翻译的接口,并用python爬取接口。大家学会后可以干一些有趣的事情,比如做一个自己的翻译软件。
具体内容
1 - 找到URL接口
进入百度翻译的网址,F12进入调式模式,点击Network,选择XHR
点击网页上的 翻 译我们会看见,多了两个XHR记录,这两个记录就是请求服务器获取翻译结果的请求。
我们点击第二条查看,点击Response (服务器返回的数据), 可以看见这个连接返回的东西就是我们想要的数据。接下来我们获取这个请求的url,模拟发送请求试试。
2 - 分析参数
我们可以看到这个记录请求的url便是图上这个,方法是post。我们接下来查看请求的参数
这个便是我们请求的参数了,可以看见有from:原语言 ,to:翻译的语言,query:翻译的字符串,
然后是transtype:翻译类型,simple_means_flag:意思尚不清楚,不过不重要,sign:这个我们后面在解释,token:这个是用来识别浏览器的,知道这些参数之后我们就可以开始写代码了。
2 - 写代码
import requestsurl = "https://fanyi.baidu.com/v2transapi"headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}queryString = "人生苦短,我用python"data = { 'from': 'en', 'to': 'zh', 'query': queryString, 'simple_means_flag': 3, 'sign': "289133.35420