python爬取并翻译_教大家用python爬取百度翻译,超简单-Go语言中文社区

一,首先导入urllib里面的request和parse:这里导入parse主要字符转码

from urllib import request,parse

二,爬取别人的网站最好加入伪装,也就是浏览器的请求里的User-Agent,可以有效的过滤掉别人的反爬,

headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.75 Safari/537.36'}

三,因为百度翻译是post请求,所以需要封装,还要对需要翻译的字体进行转码,要不会爬取不到页面

dict={'kw':'job'}#需要翻译的内容

new_name=parse.urlencode(dict)#进行转码

url='https://fanyi.baidu.com/sug'#url 连接

response=request.Request(url,headers=headers,data=bytes(new_name,encoding='utf-8'))#进行封装

四,爬取数据

text=request.urlopen(response).read().decode('utf-8')#爬取数据

五,由于数据是json格式,所以我们需要用json读取,所以导入json模块

import json

content=json.loads(text)

print(content)

结果:

自己可以格式化一下数据

有道翻译也可以爬取,多了一个随机值和md5加密,自己也可以找规律进行爬取的,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值