Python自动填写问卷星
在前段时间自己编写了一段Selenium的的代码(当然是不包含识别验证码的工序的),在应用的过程中,发现了代码修改比较麻烦,每个click控件的选项上都需要添加一次xpath路径,在选择题较少的情况下,情况还好,但是选择题的数目和选项一旦增多就会造成代码修改的复杂程度。下面给出一个表做一个形象的说明
数量
添加xpath次数
10道题 每道题4个选项
40
30道题 每道题4个选项
120
30道题 每道题8个选项
240
添加如此多次的xpath路径,会造成不必要的麻烦,xpath路径具有一定的规律性,比如说我这篇
第一道题的A选项://*[@id=“divquestion1”]/ul/li[1]/a
第一道题的B选项://*[@id=“divquestion1”]/ul/li[2]/a
第二道题的A选项://*[@id=“divquestion2”]/ul/li[1]/a
你们是否已经发现了规律呢?当然我们还是重申一下需要用到的几个函数吧
需要用到的一些知识
random.choice(),括号里面可以放一个列表,这样可以随机输出列表当中的某个元素
xpath定位网页元素 driver.find_element_by_xpath
对元素进行操作,有点击click和填入send_keys
字符串的拼接 ‘’//*[@id=“divquestion’ + str(m) + '”]/ul/li[’ + str(q) + ‘]/a’’
函数体的设计以及if-else选择语句
一、问卷形式
Ⅰ、只有单选题的问卷
见
from selenium import webdriver import random # //*[@id="divquestion1"]/ul/li[2]/a def monomial_choice(m, n): # m为题号 n为选项数 q = random.choice(list(range(1, n + 1))) xpath = '//*[@id="divquestion' + str(m) + '"]/ul/li[' + str(q) + ']/a' driver.find_element_by_xpath(xpath).click() for i in range(100): driver = webdriver.Chrome() driver.get('https://www.wjx.cn/jq/88552774.aspx') for m in range(1, 11): if m == 2: monomial_choice(m, 4) # 第二题四个选项 else: monomial_choice(m, 5) # 除了第二题都有五个选项 driver.find_element_by_xpath('//*[@id="submit_button"]').click() # 提交按钮 print('第' + str(i + 1) + '次填写') driver.quit() # 关闭浏览器
只有短短的数句代码,就可以运行了,是不是很简洁呢。关于代码的修改方式: 我这里定义了一个选择题的函数,在函数内部有一个xpath的路径的字符串拼接方式,把这个字符串拼接方式进行修改,其中两个参数m为题号数,n为单选题的选项个数,这个函数起到随机选择此道选题题某选项进行点击的作用。主函数中设置浏览器驱动器对象,通过get方法获得网址,通过点击单选题以及提交的按钮进行循环。
这里一次性能刷大约30份左右,因为出现了验证码的问题,这里先不讨论验证码的处理过程。
Ⅱ、单选题与多选题并存的问卷
多选题就是在单选题的基础上,在几个选项里挑选多个选项进行点击,那么首先要了解python给予我们的随机数机制。
我们依然假设A、B、C、D四个选项中xpath的标签中含有1、2、3、4这四个字符串类型,多选是指两个或者两个以上选项的选择题。利用sample函数可以实现这一点。
函数举例
from random import sample num = list(range(1, 5)) n = sample(num, 2)
num的列表形式为[1,2,3,4] n从num随机挑选两个元素作为列表中的元素
>>> n [2, 4]
问卷见
import random from selenium import webdriver # //*[@id="divquestion1"]/ul/li[2]/a def monomial_choice(m, n): # m为题号 n为选项数 q = random.choice(list(range(1, n + 1))) xpath = '//*[@id="divquestion' + str(m) + '"]/ul/li[' + str(q) + ']/a' driver.find_element_by_xpath(xpath).click() def multiterm_choice(m, n): # m为题号 n为选项数 q = list(range(1, n + 1)) # 多选题的所有索引[1,2,3,4] c = random.randint(1, n) # 设置多选题选择的个数 q = random.sample(q, c) # 多选题选择列表 for i in q: xpath = '//*[@id="divquestion' + str(m) + '"]/ul/li[' + str(i) + ']/a' driver.find_element_by_xpath(xpath).click() for i in range(100): driver = webdriver.Chrome() driver.get('https://www.wjx.cn/jq/88879171.aspx') monomial_choice(1, 2) monomial_choice(2, 4) monomial_choice(3, 2) multiterm_choice(4, 7) multiterm_choice(5, 7) monomial_choice(6, 6) monomial_choice(7, 5) multiterm_choice(8, 5) monomial_choice(9, 3) monomial_choice(10, 5) monomial_choice(11, 6) monomial_choice(12, 5) driver.find_element_by_xpath('//*[@id="submit_button"]').click() # 提交按钮 print('第' + str(i + 1) + '次填写') driver.quit() # 关闭浏览器
Ⅱ、单选题、多选题与填空题并存的问卷
填空题无非是修改了效果控件,send_keys()给空里一个值
import random from selenium import webdriver # //*[@id="divquestion1"]/ul/li[2]/a def monomial_choice(m, n): # m为题号 n为选项数 q = random.choice(list(range(1, n + 1))) xpath = '//*[@id="divquestion' + str(m) + '"]/ul/li[' + str(q) + ']/a' driver.find_element_by_xpath(xpath).click() def multiterm_choice(m, n): # m为题号 n为选项数 q = list(range(1, n + 1)) # 多选题的所有索引[1,2,3,4] c = random.randint(1, n) # 设置多选题选择的个数 q = random.sample(q, c) # 多选题选择列表 for i in q: xpath = '//*[@id="divquestion' + str(m) + '"]/ul/li[' + str(i) + ']/a' driver.find_element_by_xpath(xpath).click() def Completion(m): # m为题号 xpath = '// *[ @ id = "q' + str(m) + '"]' # 填空题xpath路径 choice_list = ['质量不高', '价格不低', '难闻味道', '质感不好'] # 填空的几个选项 n = random.choice(list(range(0, len(choice_list) - 1))) # 随机生成选项下标 choice = choice_list[n] driver.find_element_by_xpath(xpath).send_keys(choice) for i in range(100): driver = webdriver.Chrome() driver.get('https://www.wjx.cn/jq/88875651.aspx') monomial_choice(1, 4) monomial_choice(2, 4) multiterm_choice(3, 7) monomial_choice(4, 5) monomial_choice(5, 4) Completion(6) driver.find_element_by_xpath('//*[@id="submit_button"]').click() # 提交按钮 print('第' + str(i + 1) + '次填写') driver.quit() # 关闭浏览器