(1)借鉴了不少大神的解决方法,因为是批量导入数据,所以单选多选并不重要(单选题的起止数据相同,多选题不同),故而没做题型判断。
(2)有问题的地方直接用try/excpet容错了,比如说题号跳转时的无法定位,以及矩阵单选题没法填写的问题。
(3)最后用单独的段落来处理矩阵单选题,因为这部分采用随机填写,因此在Excel导入时直接留白就行了。总体来说容错率比较高,但是效果比较好。
(4)本身问卷选题比较多,每道题填写时预留足够的时间不需要太多,因此暂且避免了人机验证(谢不杀之恩)。
备注:某种特定情况下(选题较少),会出现selenium无法定位的问题,需要滚动鼠标到选项(或者直接滚屏)才能正确运行,这个问题没法try掉,所以用了js语句来处理。
完整代码如下(url请自行参考):
from selenium import webdriver
import time
import random
import pandas as pd
start_time = time.time() #计算程序运行时间
data = pd.read_excel('data.xlsx',sheet_name=0) #读取数据文件
driver = webdriver.Chrome() #调用chrome浏览器
# 获取问卷问题
def get_questions(url):
# 模拟登录问卷
driver.get(url)
# 通过class定位问卷题目所在tag
questions = driver.find_elements_by_class_name('div_question')
ret