python爬取外文文献翻译_利用Python爬取翻译网站的翻译功能

最新推荐文章于 2023-01-10 20:56:22 发布

weixin_39589923

最新推荐文章于 2023-01-10 20:56:22 发布

阅读量900

点赞数

文章标签： python爬取外文文献翻译

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39589923/article/details/111882724

版权

本文介绍了使用Python爬取翻译网站http://fy.iciba.com/的翻译功能，通过urllib和requests库伪装浏览器请求，实现了中英文之间的翻译。代码中定义了一个fanyi类，包含translate方法，根据返回的状态码判断并输出翻译结果。

摘要由CSDN通过智能技术生成

现在我想分享一个利用Python技术，爬取一个翻译网站的翻译功能的小代码。

首先隆重介绍我们今天将要爬取的网站：http://fy.iciba.com/

咱们用Python中的urllib模块的功能进行爬取

众所周知，在爬虫的准备工作中我呢吧需要确定咱们爬取网站的url

那么，这个翻译网站的url如何确定呢？

我们进入网站，并单击F12打开开发者工具(这里我们用的谷歌浏览器)

这个网站的翻译功能分为两个部分：英译汉汉译英

然后我决定先翻译两个单词玩玩！翻译的同事不关闭开发者工具，观察其变化。

事实证明这个网站的翻译能力还有待加强，毕竟每一个NBA球迷都知道laker是湖人的意思嘛！

在翻译的过程中我们发现他有一个地方在每一次翻译的时候都会增加一个：ajax.php?a=fy

打开这两个都可以在下面的Form Data中找到我们想要检索的单词

这个时候

我们发现这里的Request URL 是一个常量，每次的搜索时都不会改变，改变的部分仅限于底部的Form Data，所以我们可以确定这个搜索网站的base_url就是：

你小子啦！！

<

最低0.47元/天解锁文章

weixin_39589923

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。