python爬取外文文献翻译_利用Python爬取翻译网站的翻译功能

本文介绍了使用Python爬取翻译网站http://fy.iciba.com/的翻译功能,通过urllib和requests库伪装浏览器请求,实现了中英文之间的翻译。代码中定义了一个fanyi类,包含translate方法,根据返回的状态码判断并输出翻译结果。
摘要由CSDN通过智能技术生成

现在我想分享一个利用Python技术,爬取一个翻译网站的翻译功能的小代码。

首先隆重介绍我们今天将要爬取的网站:http://fy.iciba.com/

咱们用Python中的urllib模块的功能进行爬取

众所周知,在爬虫的准备工作中我呢吧需要确定咱们爬取网站的url

那么,这个翻译网站的url如何确定呢?

我们进入网站,并单击F12打开开发者工具(这里我们用的谷歌浏览器)

这个网站的翻译功能分为两个部分:英译汉 汉译英

然后我决定先翻译两个单词玩玩!翻译的同事不关闭开发者工具,观察其变化。

事实证明这个网站的翻译能力还有待加强,毕竟每一个NBA球迷都知道laker是湖人的意思嘛!

在翻译的过程中我们发现他有一个地方在每一次翻译的时候都会增加一个:ajax.php?a=fy

打开这两个都可以在下面的Form Data中找到我们想要检索的单词

这个时候

我们发现这里的Request URL 是一个常量,每次的搜索时都不会改变,改变的部分仅限于底部的Form Data,所以我们可以确定这个搜索网站的base_url就是:

你小子啦!!

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值