做了一个页面循环点击的脚本。
首先登录就遇到两个问题,首先是输入用户名密码,这个故意输入错密码就知道postData 的格式了,然后是token问题,直接get页面就获取到token了。
接着发现点击button的是get 命令,这个就简单了。获取状态也是get命令,用正则表达式匹配一下就好了。这样说起来好像挺简单的,源码如下:
# -*- coding: utf-8 -*-
import re
import configparser
import requests
from bs4 import BeautifulSoup
import time
userAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"
tokenUrl = "http://..."
postUrl = "http://..."
sessHtml = requests.Session()
header = {
"Host": "****.com",
"origin": "http://.com",
"Referer": "http://code.****.com/users",
'User-Agent': userAgent,
}
def get_token():
r = sessHtml.get(tokenUrl, headers = header)
soup = BeautifulSoup(r.text, "html.parser")
find_str =