python学习值爬取百度翻译

最新推荐文章于 2024-06-21 13:12:49 发布

青之羽

最新推荐文章于 2024-06-21 13:12:49 发布

阅读量407

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/qq_34970891/article/details/109287290

版权

python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

# 功能：  进行爬虫项目编写
# 开发时间： 2020/10/26  10:12
import requests
import json
if __name__ == '__main__':
    #进行UA伪装,将userAgent分装到一个字典对象当中去,user-agent可以到浏览器当中通过抓包工具来获取
    headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
    url = 'https://fanyi.baidu.com/sug'
    word=input("请输入要查询的单词\n")
    data={
        'kw':word
    }
    response=requests.post(url,data=data,headers=headers)
    response.encoding='utf-8'#有时候所爬取的网页会发生乱码的现象,所以要对其进行编码
    page_text=response.text#获取请求的文本信息
    #当服务器对象所响应的字符串数据类型为json的时候，可以调用json方法类获取json字符串对象
    dic_obj=response.json()#将获取到的多组json字符串数据以字典的方式来进行存放
    print(dic_obj)
    #对爬取到的数据对象进行持久化存储
    filename=word+'.json'
    fp=open(filename,'w',encoding='utf-8')
    json.dump(dic_obj,fp,ensure_ascii=False)#因为获取的字符串对象是中文，所以不能够进行ASCII编码
    print("存储完毕")

请输入要查询的单词
application
{'errno': 0, 'data': [{'k': 'application', 'v': 'n. 申请; 请求; 申请书; 申请表; (尤指理论、发现等的)应用，运用; 涂抹; 敷用; 施用;'}, {'k': 'applications', 'v': 'n. 申请; 请求; 申请书; 申请表; (尤指理论、发现等的)应用，运用; 涂抹; 敷用; 施用;'}, {'k': 'Application Engineer', 'v': '网络应用工程师; 产品应用工程师; 技术工程师; 應用工程師; 应用系统工程师;'}, {'k': 'application form', 'v': ' 申请表;'}, {'k': 'application letter', 'v': '网络英语求职信; 申请信; 求职信; 英文求职信; 一封求职信;'}]}
存储完毕

青之羽

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python学习值爬取百度翻译

# 功能：进行爬虫项目编写# 开发时间： 2020/10/26 10:12import requestsimport jsonif __name__ == '__main__': #进行UA伪装,将userAgent分装到一个字典对象当中去,user-agent可以到浏览器当中通过抓包工具来获取 headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (K...
复制链接

扫一扫

专栏目录