# 功能: 进行爬虫项目编写
# 开发时间: 2020/10/26 10:12
import requests
import json
if __name__ == '__main__':
#进行UA伪装,将userAgent分装到一个字典对象当中去,user-agent可以到浏览器当中通过抓包工具来获取
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
url = 'https://fanyi.baidu.com/sug'
word=input("请输入要查询的单词\n")
data={
'kw':word
}
response=requests.post(url,data=data,headers=headers)
response.encoding='utf-8'#有时候所爬取的网页会发生乱码的现象,所以要对其进行编码
page_text=response.text#获取请求的文本信息
#当服务器对象所响应的字符串数据类型为json的时候,可以调用json方法类获取json字符串对象
dic_obj=response.json()#将获取到的多组json字符串数据以字典的方式来进行存放
print(dic_obj)
#对爬取到的数据对象进行持久化存储
filename=word+'.json'
fp=open(filename,'w',encoding='utf-8')
json.dump(dic_obj,fp,ensure_ascii=False)#因为获取的字符串对象是中文,所以不能够进行ASCII编码
print("存储完毕")
请输入要查询的单词
application
{'errno': 0, 'data': [{'k': 'application', 'v': 'n. 申请; 请求; 申请书; 申请表; (尤指理论、发现等的)应用,运用; 涂抹; 敷用; 施用;'}, {'k': 'applications', 'v': 'n. 申请; 请求; 申请书; 申请表; (尤指理论、发现等的)应用,运用; 涂抹; 敷用; 施用;'}, {'k': 'Application Engineer', 'v': '网络 应用工程师; 产品应用工程师; 技术工程师; 應用工程師; 应用系统工程师;'}, {'k': 'application form', 'v': ' 申请表;'}, {'k': 'application letter', 'v': '网络 英语求职信; 申请信; 求职信; 英文求职信; 一封求职信;'}]}
存储完毕