午餐订餐
在公司每天要线上订餐。因为每次都忘记,所以考虑通过爬虫自动完成,顺便练练手。在这里记录我的过程。
工具:fiddler,pycharm
语言:python
一,fiddler抓包HTTPS请求:
我下载的版本是finddler 4。因为在利用finddler抓包过程中,发现URL为https请求。因此顺便在这里记录下fiddler抓https包的配置。
图一
图二
二,分析HTTPS包:
图三
图四
根据图三,可以获得所有的参数,分析网页的源码可以发现,authenticity_token参数是一个将input 标签隐藏值value值。在这里利用BeautifulSoup进行获取并存放于字典中,相对应代码如下:
图五
三,源码
import requests
from bs4 import BeautifulSoup
ses=requests.session()
payload={"authenticity_token":"9yRu9/Yyg6JulansCiXPIyLgesz1m/US2JEgb5ZcBZ3EBE/V+grgOZYWvoF0c8NjSrQ5eOejLTbofS/uY1IRsQ==",\
"entry[field_20]":"1G9F","entry[field_16]":"g1Bs","entry[field_15]":"5zCn","entry[field_14]":"B4lh"}
url="https://jinshuju.net/0000000"
r=ses.get(url)
if r.status_code!=200:
print("订餐失败")
exit(0)
name=input("please input your name")
payload["entry[field_3]"]=name
soup=BeautifulSoup(r.text)
authenticity_token=soup.body.form.find("input",attrs={"name":"authenticity_token"})
if not authenticity_token:
print("error")
else:
print(authenticity_token["value"])
payload["authenticity_token"]=authenticity_token["value"]
print(r.status_code)
# print(r.text)
r=ses.post(url,data=payload,verify=True)
if r.status_code==200:
print("订餐完成")
else:
print("订餐失败")