小编在学习英语的时候,遇到不认识的英语单词,会用百度翻译来查询单词的释义和音标,并播放单词的读音。为了便于复习和记忆,需要将单词的释义和音标以复制粘贴的方式保存到本地。
这个过程非常繁琐,于是小编就想能否利用Python写一个爬虫小程序,来自动完成这些工作呢?
为了完成这样一个小程序,我们需要完成以下几个步骤:
1.输入单词,查询单词的释义和音标
2.下载音频并播放读音
3.保存到本地Excel文件中,并自动调整格式
4.打包成可执行的exe程序
在本篇文章中,我们将讲解如何完成第一个步骤:输入单词,查询单词的释义和音标。
1
打开百度翻译,确定需要抓取的信息
打开以后,我们输入单词“Python”,点击网页中的“翻译”按钮进行查询,出现如下图所示内容。用红框框出的单词释义和音标,是我们需要抓取的信息。
同时,我们想要单词的释义和音标在Excel中以下图所示的结构保存。
2
利用开发者工具(DevTools)进行抓包分析
以Chrome浏览器为例,我们可以通过以下方式打开开发者工具:
1. 在网页空白处点击右键,然后左键点击“检查”
2. Ctrl + Shift + I
3. F12
打开以后,点击“Network”选项,如下图所示:
根据提示,我们按“F5”刷新网页,网页重新加载,在“Network”面板中,可以看到从服务器发送过来的数据,包括HTML文件、JS文件、图片等。
<