一、授人以鱼
如果想直接拿代码就用,不想了解具体设计思路,那看本节内容就够了。到文末复制代码,以下是使用教程:
需要在main函数给定3个参数,URL(问卷的链接)、answer(问卷答案),num(需要填写的份数)。
answer的格式是 题号+$+答案,如果是单选题,那答案就是选项序号,如果是多选题,用 | 作为分隔符将多个答案拼接,如果是填空题,那答案就直接是文本,多道题使用 } 进行分隔。例如,answer='1$1}2$2}3$3|4}4$问卷测试' ,表示第一题选第一个,第二题选第二个,第三题是多选题,选第3和4个,第五题是填空题,填入’问卷测试’。有没有感觉很复杂hhh,有简单的方法得到答案序列,用浏览器打开问卷链接,填写问卷,然后按F12进入调试模式,第一行选network项,然后提交问卷,左边选择第一行(或者name是这个的),右边拉到最下面,submitdata后面的就是参数answer应该填的值。顺序不要乱,填写问卷不提交→打开调试模式→提交问卷→查看submitdata项。
另外,运行代码后,控制台会有输出,输出的数据中,10开头的是填写成功,22开头的是填写失败,失败的概率不高。
二、授人以渔
这里我介绍代码的实现思路。很容易想到,我们应该通过某个URL,把数据发送给问卷星的服务器。所以要解决的问题是URL是哪个,数据的格式是什么。通过填写问卷不提交,打开浏览器的调试模式,然后提交问卷,可以查看提交问卷之后发送的请求。
解读这个发送请求:
- URL:https://www.wjx.cn/joinnew/processjq.ashx
- 传参方式:POST
- GET参数(以下参数通过get参数拼接方式拼接到URL后面):
submittype: 1
curID: 73771803
t: 1589691842642
starttime: 2020/5/17 13:02:42
ktimes: 110
rn: 1901991322
hlv: 1
sd: http://www.wjx.cn/
jqnonce: d29970a5-3308-46ea-b7f2-d510d8cc52dc
jqsign: e38861`4,2219,57d`,c6g3,e401e9bb43eb
jpm: 15
5.POST参数
submitdata:1$1}2$3}3$2|4}4$问卷测试
必要参数的含义
submittype: 问卷类型,一般的问卷应该是1
curID: 可能是问卷ID,可以从response中获取
t: 时间戳+三位随机数
starttime: 打开问卷的时间,可以随机生成
ktimes: 问卷填写时长吧,可以随机生成
rn: 不知道,可以从response中获取
hlv: 好像没啥用的一个参数,没有也行
jqnonce: 不知道,可以从response中获取
jqsign: 不知道,根据rn和jqnonce生成
submitdata: 提交的答案
jqsign生成方式(JS代码),需要将其转为python代码
dataenc(a)
{
var b = ktimes % 10;
b == 0 && (b = 1);
for (var d = [], c = 0; c < a.length; c++) {
var f = a.charCodeAt(c) ^ b;
d.push(String.fromCharCode(f))
}
return d.join("")
}
关于IP的问题
同一IP多次提交会让你输入验证码,识别验证码并提交有点难,所以可以考虑每次换不同的IP,在请求头header里设置就行
好了,到这里,URL知道了,参数及获取方式也知道了,具体实现方式就看下面的代码吧
三、代码
# -*- coding: utf-8 -*-
"""
Created on Sun May 17 09:27:04 2020
@author: Z
"""
import requests
import re
import time
import random
def getJqsign(ktimes, jqnonce):
result = []
b = ktimes % 10
if b == 0:
b = 1
for char in list(jqnonce):
f = ord(char) ^ b
result.append(chr(f))
return ''.join(result)
def run(url,answer):
ip = '{}.{}.{}.{}'.format(112, random.randint(64, 68), random.randint(0, 255), random.randint(0, 255))
header = {
'X-Forwarded-For': ip,
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',
}
response=response = requests.get(url=url, headers=header)
cookie = response.cookies
ktimes = random.randint(15, 50)
jqnonce = jqnonce = re.search(r'.{8}-.{4}-.{4}-.{4}-.{12}', response.text).group()
rn = re.search(r'\d{9,10}\.\d{8}', response.text).group()
id = re.search(r'\d{8}', response.text).group()
jqsign = getJqsign(ktimes, jqnonce)
start_time = start_time = re.search(r'\d+?/\d+?/\d+?\s\d+?:\d{2}', response.text).group()
time_stamp = '{}{}'.format(int(time.time()), random.randint(100, 200))
postUrl = 'https://www.wjx.cn/joinnew/processjq.ashx?submittype=1&curID={}&t={}&starttim' \
'e={}&ktimes={}&rn={}&jqnonce={}&jqsign={}'.format(id, time_stamp, start_time, ktimes, rn, jqnonce, jqsign)
data = {
'submitdata': answer
}
response = requests.post(url=postUrl, data=data, headers=header, cookies=cookie)
print(response.content.decode())
print()
if __name__ == '__main__':
url='https://www.wjx.cn/jq/73771803.aspx' #问卷链接
answer='1$1}2$2}3$3|4}4$问卷测试' #答案
num=10 #填写份数
for i in range(0,num):
run(url,answer)