python爬取百度图片_爬虫 python爬取百度翻译接口超详细附源码

最新推荐文章于 2022-01-17 20:47:35 发布

weixin_40001395

最新推荐文章于 2022-01-17 20:47:35 发布

阅读量172

点赞数

文章标签： python爬取百度图片 python爬虫源码

前言

今天教大家如何利用 firefox 分析百度翻译的接口，并用python爬取接口。大家学会后可以干一些有趣的事情，比如做一个自己的翻译软件。

具体内容

1 - 找到URL接口

进入百度翻译的网址，F12进入调式模式，点击Network，选择XHR

点击网页上的翻译我们会看见，多了两个XHR记录，这两个记录就是请求服务器获取翻译结果的请求。

我们点击第二条查看，点击Response (服务器返回的数据)，可以看见这个连接返回的东西就是我们想要的数据。接下来我们获取这个请求的url，模拟发送请求试试。

2 - 分析参数

我们可以看到这个记录请求的url便是图上这个，方法是post。我们接下来查看请求的参数

这个便是我们请求的参数了，可以看见有from:原语言 ,to:翻译的语言,query:翻译的字符串，

然后是transtype:翻译类型，simple_means_flag:意思尚不清楚，不过不重要，sign:这个我们后面在解释，token:这个是用来识别浏览器的，知道这些参数之后我们就可以开始写代码了。

2 - 写代码

import requestsurl = "https://fanyi.baidu.com/v2transapi"headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}queryString = "人生苦短,我用python"data = { 'from': 'en', 'to': 'zh', 'query': queryString, 'simple_means_flag': 3, 'sign': "289133.35420