Python爬取问卷星内容

最新推荐文章于 2024-11-28 13:18:14 发布

teanll

最新推荐文章于 2024-11-28 13:18:14 发布

阅读量3.9k

点赞数 3

文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/rallaa/article/details/126754026

版权

Python爬取问卷星内容

问卷星标题和选项内容爬取
从以下博客中学习到的，加了些自己的解释
Python3 爬虫— 问卷星内容爬取
先贴代码：

import time
from requests_html import HTMLSession
 

wenjuanxing_URL = "https://ks.wjx.top/jq/55123312.aspx"
 
 
def parse_post_data(resp):
    questions = resp.html.find('fieldset', first=True).find('.div_question')
 
    for i, q in enumerate(questions):
        title = q.find('.div_title_question_all', first=True).text
        choices = [t.text for t in q.find('label')]
        print(title)
        for choice in choices:
            print(choice)
        print('***************************************************\n')
        time.sleep(0.5)


def main():
    print('开始爬取问卷内容')
    print('链接:%s' % wenjuanxing_URL)
    session = HTMLSession()
    resp = session.get(wenjuanxing_URL)
    parse_post_data(resp)


if __name__ == '__main__':
    main()

需要导入time和requests_html包，没有的可以在python目录下用pip下载

questions = resp.html.find('fieldset', first=True).find('.div_question')

这里的filedset是包含所有题目和答案的标签

题目内容

title = q.find('.div_title_question_all', first=True).text

对应题目选项

choices = [t.text for t in q.find('label')]

控制台运行：
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

teanll

关注关注

3
点赞
踩
26

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python网络问卷爬虫教程：如何爬取在线问卷平台的数据

2201_76125261的博客

03-25

648

本文详细介绍了如何使用 Python 编写爬虫，抓取在线问卷平台的数据。我们通过使用requests和抓取静态页面的数据，使用Selenium抓取动态页面的数据，最后将抓取的数据存储到 CSV 文件中，方便后续分析。希望这篇博客能帮助你掌握网络问卷数据爬取的基本技巧，帮助你更高效地获取问卷数据，为你的数据分析和决策提供支持。

WJX_Autosubmit:问卷星问卷自动提交，Python3版本，2020年8月仍有效

05-27

更新 2021-01-19 又是一年过去，再次打开自己的划水项目。看看问卷星又上了哪些反爬虫机制。目前问卷星部署了阿里云的，cookies中新增了一些参数。本人才疏学浅，且懒，导致无法继续。在此留下一些参考项目已供后者参考。 WJX_Autosubmit 问卷星自动提交，Python3版本，2020年8月仍有效。采用构建随机答案，不支持验证码。目前github上的可用版本并不多，同时个人接触较多问卷星的问卷，便萌生了用Python3的爬虫来完成问卷的想法，同时，作为学习的项目。程序运行安装依赖。 pip install -r requirements.txt 帮助信息 Usage: WJX_Autosubmit.py [OPTIONS] Options: -p or --pool use proxy from github.com/jhao104/prox

2 条评论您还未登录，请先登录后发表或查看评论

问卷星python爬虫资源

11-01

问卷星python爬虫资源

python爬取问卷星内容_Python 自动填写问卷星（适用问卷星的所有类型题目）

weixin_39767121的博客

12-07

1161

为应付“上面”的需要，公司接了个帮助推广市政公益项目的问卷。整个问卷有单选题、多选题、填空题、日期框、地理位置框、矩阵多选和矩阵单选等几乎涵盖了问卷星所有类型问题的问卷，题目有近70题，正常做一遍需要半个小时左右，尝试各渠道推广了一下，推了三天收到了10份样本，和要求的5000份样本相距甚远，于是这个活就到了我的头上。有在csdn 和 git上看了下类似项目，基本就是 python+seleniu...

Python3 爬虫--- 问卷星内容爬取

wozaiyizhideng的博客

06-02

6747

今天面试有个问卷星的笔试题，但是无法复制题目内容。所以爬取一下。 import time from requests_html import HTMLSession wenjuanxing_ID = id wenjuanxing_URL = "https://ks.wjx.top/jq/{}.aspx".format(wenjuanxing_ID) def parse_post_data(resp): ''' 解析出问题和选项 ''' questions .

Python爬取问卷星问题与选项

qq_43656233的博客

05-18

2895

代码实现 import requests from bs4 import BeautifulSoup res = requests.get(url="https://.aspx") # 网站输入自己需要爬取的网站 soup = BeautifulSoup(res.text,"html.parser") subject = soup.findAll(attrs={"class":"field ui-field-contain"}) for sub in subject: question=sub

问卷星爬虫（不带验证码）

11-17

用于问卷星自动提交，不带验证码，使用前请先根据fiddler抓包情况分析并修改参数

python 从题库excel中读取需要的属性生成json，然后爬取问卷星比对出答案

shiyu_mj的博客

01-05

971

import pandas as pd import re import json df=pd.read_excel('文化题库.xlsx',sheet_name ='Sheet1') k='[A-Z]' dic={} #清空base.txt with open('base.txt','w') as f: pass #表格第一行被读取成columns了,所以从1开始 for i in range(1,161): line=df.iloc[i] #line[8]有na

如何使用python爬虫技术爬取问卷星试题（附完整源码）

2301_79728932的博客

11-23

1219

上述代码运行首先需导入time，requests，re三个Python库，其中time是用于让当前执行的线程暂停指定的秒数，增加获取资源缓冲时间；requests库支持多种 HTTP 请求方法，如 GET、POST、PUT、DELETE 等，并且可以自动处理 cookies、会话（sessions）、重定向等 HTTP 特性；在运行过程中，可能会遇到 NameError: name is not defined 问题，请检查以上三个库是否成功导入，若没有下载以上库，可以在Python目录下用pip下载。

python爬取问卷星内容,Python 问卷星自动填写爬虫

weixin_36225384的博客

03-26

3074

Python帮你填问卷星ps：网上看到的代码，虽然技术不深，但我觉得挺有用的，所以在此分享给大家在某段时间朋友圈是否一直充斥着各种问卷调查，为了达成某种要求我们不断向好友求助填写问卷，今天，我就把下面这个自动填写问卷的神器交给你，再有人找你填问卷直接给他交100份~当然在此之前你需要先在你的电脑上装上 python 2.7import requestsimport reimport timeimp...

python爬取问卷星内容_Python Selenium 问卷星自动填写

weixin_39883256的博客

02-21

1003

从问卷星网站找的一个模板编写思路大致是这样xpath定位网页元素driver.find_element_by_xpath对元素进行操作，有点击click和填入send_keys最后点击提交问卷//*[@id="submit_button]结束若想要多份问卷写个循环套外面即可注意事项要下载相应版本的Chormedriver放在python文件夹里做驱动填写问卷时，定位元素只能定位到可视化区域，看不...

问卷星爬虫（带验证码）

11-17

本爬虫若自己修改需要一定的编程基础，可参考http://blog.csdn.net/gcs1024/article/details/78559488

Fiddle抓包工具

06-01

Fiddler是一个http协议调试代理工具，它能够记录并检查所有你的电脑和互联网之间的http通讯，设置断点，查看所有的“进出”Fiddler的数据，实现抓包效果

python代码实现问卷星问卷内容获取并写入word文档保存

最新发布

masakinini的博客

11-28

435

【代码】python代码实现问卷星问卷内容获取并写入word文档保存。

python爬取问卷星详细操作

04-11

首先你可以使用Python内置的urllib库或者第三方库requests来请求问卷星的页面，获取页面源代码。其次，使用正则表达式或者BeautifulSoup等库来解析页面，提取问卷题目、选项等信息。然后，模拟用户行为完成问卷...

python爬取问卷星内容_python问卷星爬虫bug求助

weixin_39589557的博客

12-07

872

[TOC]原bugMaxRetryError: HTTPConnectionPool(host='127.0.0.1', port=9659): Max retries exceeded with url: /session/14150baedf86c6930897efe3675806f3/element (Caused by NewConnectionError(': Failed to est...

python爬虫之自动填写问卷星调查表

云梦归遥【qq_45834685】

11-08

1252

系列文章目录 python爬虫之自动填写问卷星调查表提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、python爬虫填写问卷星二、使用步骤总结请求数据获取标签循环获取标签，填写问卷截图保存为证前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可..

python实现问卷星自动填写（详细版）

weixin_64511576的博客

01-25

8008

当问卷中有十个单选，可直接判断进行自动答题，也可设置其中一题为特定答案。# 第一页，通过f12发现可用的标签有十个，且第一个是废标签，所以不用管#对应的绝对子标签# 找到对应题，然后进行答题if i == 2:else:if为多少就是多少题，循环需设置你题目共有多少选择题。# 第二页，通过f12发现可用的标签有11-25个，且第一个是废标签，所以不用管#对应的绝对子标签s.click()s.click()

python如何爬取问卷星内容

04-11

要爬取问卷星内容，可以使用Python的第三方库BeautifulSoup和requests。具体步骤如下： 1. 用requests库访问问卷星网站，获取问卷的HTML代码； 2. 使用BeautifulSoup解析HTML代码，找到问卷内容所在的标签，并提取...