学习笔记
备注:这个Blog也是part14
爬取有道
写个案例,我想要破解有道翻译(http://fanyi.youdao.com/)接口,抓取翻译结果。
一开始,我还以为写这个不是很麻烦,因为2年前玩网爬的时候,最先写的小案例就是爬取翻译结果。但是现在,我重新写一遍,不知道为啥,研究了半天,心力交瘁,可能是人老了。
爬取步骤
①获取要爬取的有道翻译URL地址(http://fanyi.youdao.com/)
②在有道页面中翻译单词,抓取数据包
③查看,并解析FROM表单
④敲python代码,输入要翻译的内容,发送post请求
⑤得到翻译结果
熟悉抓包
在正式开始抓包之前,我们先熟悉一下怎么抓包
备注:抓包(packet capture)就是将网络传输发送与接收的