【Python】爬虫 | 有道翻译

我的学习参考教程:http://c.biancheng.net/view/2011.html

因为我是初学者,所以有很多基础的问题,这只是我自己记录自己学习的一个工具而已,希望大家不要因此而嘲笑我。

我今天做的是使用requests.post抓取有道翻译。
使用 requests.post 方法抓取有道翻译结果的完整代码如下:

import requests        #导入requests包
import json
def get_translate_date(word=None):
    url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'
    From_data={'i':word,'from':'zh-CHS','to':'en','smartresult':'dict','client':'fanyideskweb','salt':'15477056211258','sign':'b3589f32c38bc9e3876a570b8a992604','ts':'1547705621125','bv':'b33a2f3f9d09bde064c9275bcb33d94e','doctype':'json','version':'2.1','keyfrom':'fanyi.web','action':'FY_BY_REALTIME','typoResult':'false'}
    #请求表单数据
    response = requests.post(url,data=From_data)
    #将Json格式字符串转字典
    content = json.loads(response.text)
    print(content)
    #打印翻译后的数据
    #print(content['translateResult'][0][0]['tgt'])
if __name__=='__main__':
    get_translate_date('我爱中国')

我自己在这个过程中遇到的问题:

  1. if __name__=='__main__':
    是什么意思?
    我搜索了一下,自己总结了一下,大概的意思是,如果当前的这个py文件是主函数的话执行,如果是作为模块被其他文件导入的时候,不执行。
    以下是我主要参考的博客:
    https://www.cnblogs.com/chen8023miss/p/11189938.html
    https://blog.csdn.net/anshuai_aw1/article/details/82344884
    另外需要注意的是,_有两个。

  2. 在我debug完了跑通了以后,显示
    {‘errorCode’: 50}
    我百度了一下,是因为有道有反爬虫机制,
    解决方法:去除url中的_o即可
    这里我还不太懂,需要进一步研究

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值