1.需求
爬取肯德基餐厅查询指定地点的餐厅数据,并实现持续化存储。
2.具体代码实现
import requests
import json
import time
if __name__=='__main__':
# 指定url
url='http://www.kfc.com.cn/kfccda/storelist/index.aspx'
# 进行UA伪装
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}
# post请求参数处理(同get请求一致)
kw=input('请输入要查询的地名:')
data={
'cname': '',
'pid': '',
'keyword':kw,
'pageIndex': 1,
'pageSize': 10,
}
# 请求发送
response=requests.post(url=url,data=data,headers=headers)
# 获取响应数据
page_json=response.text
# time.sleep(1) # 爬取一次用时1s
# print(page_text)
# 持久化存储
fileName=kw+'.json'
with open(fileName,'w',encoding='utf-8') as fp:
fp.write(page_json)
print('YES!!!')