python学习值爬取百度翻译

# 功能:  进行爬虫项目编写
# 开发时间: 2020/10/26  10:12
import requests
import json
if __name__ == '__main__':
    #进行UA伪装,将userAgent分装到一个字典对象当中去,user-agent可以到浏览器当中通过抓包工具来获取
    headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
    url = 'https://fanyi.baidu.com/sug'
    word=input("请输入要查询的单词\n")
    data={
        'kw':word
    }
    response=requests.post(url,data=data,headers=headers)
    response.encoding='utf-8'#有时候所爬取的网页会发生乱码的现象,所以要对其进行编码
    page_text=response.text#获取请求的文本信息
    #当服务器对象所响应的字符串数据类型为json的时候,可以调用json方法类获取json字符串对象
    dic_obj=response.json()#将获取到的多组json字符串数据以字典的方式来进行存放
    print(dic_obj)
    #对爬取到的数据对象进行持久化存储
    filename=word+'.json'
    fp=open(filename,'w',encoding='utf-8')
    json.dump(dic_obj,fp,ensure_ascii=False)#因为获取的字符串对象是中文,所以不能够进行ASCII编码
    print("存储完毕")

请输入要查询的单词
application
{'errno': 0, 'data': [{'k': 'application', 'v': 'n. 申请; 请求; 申请书; 申请表; (尤指理论、发现等的)应用,运用; 涂抹; 敷用; 施用;'}, {'k': 'applications', 'v': 'n. 申请; 请求; 申请书; 申请表; (尤指理论、发现等的)应用,运用; 涂抹; 敷用; 施用;'}, {'k': 'Application Engineer', 'v': '网络 应用工程师; 产品应用工程师; 技术工程师; 應用工程師; 应用系统工程师;'}, {'k': 'application form', 'v': ' 申请表;'}, {'k': 'application letter', 'v': '网络 英语求职信; 申请信; 求职信; 英文求职信; 一封求职信;'}]}
存储完毕

 

©️2020 CSDN 皮肤主题: 书香水墨 设计师:CSDN官方博客 返回首页