【提取学习通作业考试题目答案下载到本地或者POST数据库】

这段油猴(Tampermonkey)脚本是用来提取学习通(Chaoxing)平台上作业和考试题目的个人答案,并将其转换成Excel格式的题库,方便浏览或分享给他人。让我们逐步分析脚本的功能和结构:

脚本功能概述

  1. 样式插入 (insertStyle函数):

    • 功能:插入自定义的CSS样式,美化题库提取工具的界面。
    • 样式包括设置列表无序化、题目容器的样式、logo的样式等。
  2. 题目展示 (displayQuestions函数):

    • 功能:根据提取的题目数据,将题目和答案显示在浮动框中。
    • 使用了模板字符串构建题目列表,展示每道题的题目内容、选项、个人答案和正确答案。
  3. Excel下载 (downloadExcel函数):

    • 功能:将提取的题目数据转换为Excel文件并下载。
    • 使用了 xlsx.full.min.js 库来实现将数据转换为Excel的功能。
  4. 界面创建和拖动支持 (createMenuBoxsetupDraggableBox函数):

    • createMenuBox函数:创建了一个浮动的题目显示框,包含标题、解析和下载按钮等。
    • setupDraggableBox函数:实现了浮动框的拖动功能,使用户可以移动浮动框的位置。
  5. 题目解析 (parseQuestions函数):

    • 功能:从页面中解析出所有的题目数据,包括题目名称、选项内容、个人答案和正确答案。
    • 使用了 DOM 查询和操作来获取并解析每个题目的相关信息,并将解析后的数据存储在 allQsObjectallStr 中。
  6. 初始化 (init函数):

    • 功能:初始化整个脚本,包括插入样式、创建界面、设置按钮点击事件等。
    • 在初始化过程中,将页面中的题目数据提取并显示,同时设置了解析和下载按钮的点击事件。

注意事项

  • 匹配规则 (@match@require): 脚本通过 @match 指定了可以运行的页面地址,确保只在学习通平台相关页面上执行。
  • 数据处理: 脚本通过 DOM 操作和字符串处理来提取和展示题目数据,需要保证页面结构和元素的正确性和稳定性。
  • Excel导出: 使用了第三方库 xlsx.full.min.js 来处理Excel文件的生成,需要确保网络环境能够正常访问该库。

这段脚本的主要功能是帮助用户将学习通上的作业和考试题目以Excel的形式整理和导出,便于后续分析或分享。

 function displayQuestions(qObject) {
        let qULs = "";

        qObject.forEach(qNode => {
            let qLIs = "";
            qNode.nodeList.forEach(qItem => {
                let qSltString = qItem.slt.map(slt => `<li>${slt}</li>`).join('');
                let qLI = `
                    <li style="padding-left: 5px; margin: 10px 0;">
                        <div>${qItem.q}</div>
                        ${qSltString}
                        <div style="color: blue;">${qItem.myAn}</div>
                        <div style="color: red; text-align: right">${qItem.an}</div>
                    </li>
                `;
                qLIs += qLI;
            });
            let qUL = `<ul style="padding: 0;">${qNode.nodeName}${qLIs}</ul>`;
            qULs += qUL;
        });

        document.getElementById("qList").innerHTML = qULs;
    }
 function parseQuestions() {
        allQsObject = [];
        allStr = "";
        const nodeBox = document.getElementsByClassName("mark_item");

        Array.from(nodeBox).forEach(qNode => {
            let node = { nodeName: "", nodeList: [] };
            const typeTitle = qNode.querySelector(".type_tit")?.innerText || "";
            allStr += `${typeTitle}\n`;
            node.nodeName = typeTitle;

            const questions = qNode.querySelectorAll(".questionLi");
            questions.forEach(question => {
                let qItem = { slt: [], q: "", myAn: "", an: "" };
                const qName = question.querySelector(".mark_name").innerText;
                allStr += `${qName}\n`;
                qItem.q = qName;

                const qSelectBox = question.querySelector(".mark_letter");
                if (qSelectBox) {
                    const qSelectItems = qSelectBox.getElementsByTagName("li");
                    Array.from(qSelectItems).forEach(qSelectItem => {
                        const qSelectText = qSelectItem.innerText;
                        if (qSelectText) {
                            allStr += `${qSelectText}\n`;
                            qItem.slt.push(qSelectText);
                        }
                    });
                }

                try {
                    const qAnswer = question.querySelector(".mark_answer .colorGreen")?.innerText || "";
                    const qMyAnswer = question.querySelector(".mark_answer .colorDeep")?.innerText || "";
                    allStr += `${qMyAnswer}\n${qAnswer}\n`;
                    qItem.myAn = qMyAnswer;
                    qItem.an = qAnswer;
                } catch (err) {
                    console.log(err);
                }

                node.nodeList.push(qItem);
            });

            allQsObject.push(node);
        });

        displayQuestions(allQsObject);
    }

    function init() {
        insertStyle();
        createMenuBox();
        setupDraggableBox();

        document.getElementById("qTitle").innerHTML = document.querySelector(".mark_title").innerText;
        document.getElementById("jxBtn").onclick = parseQuestions;
        document.getElementById("xzBtn").onclick = () => {
            const filename = document.querySelector(".mark_title").innerText + ".xlsx";
            const data = allQsObject.reduce((arr, qNode) => {
                qNode.nodeList.forEach(qItem => {
                    arr.push({
                        '题目': qItem.q,
                        '选项': qItem.slt.join("\n"),
                        '我的答案': qItem.myAn,
                        '正确答案': qItem.an
                    });
                });
                return arr;
            }, []);
            downloadExcel(data, filename);
        };
    }

    let allQsObject = [];
    let allStr = "";

    init();
})();

感兴趣的可以根据以上去完善一下基本能实现了

Python爬虫用于抓取网页内容,学习通题库通常是教育机构使用的在线平台,包含课件、试题等资源。要爬取学习通题库的数据,你需要遵循以下几个步骤: 1. **安装必要的库**:首先,确保已安装`requests`库来发送HTTP请求,以及如`beautifulsoup4`或`lxml`用于解析HTML。 ```python pip install requests beautifulsoup4 ``` 2. **获取登录信息和cookies**:如果需要登录才能访问题库,需要先通过登录页面获取session或cookies,这通常涉及到模拟表单提交。 3. **构造URLs**:学习通题库的URL结构可能会有变化,找到包含题目数据的部分,可能是课程详情页、练习册或考试列表。 4. **提取数据**:使用BeautifulSoup或其他解析工具遍历页面DOM结构,查找包含题目答案的HTML元素,并提取所需的信息。可能涉及CSS选择器或XPath表达式。 5. **处理反爬机制**:注意网站可能会有防止爬虫的策略,比如验证码、IP限制、频率控制等,需要适当调整爬取速度和设置代理。 6. **保存结果**:将抓取的数据存储到本地文件或数据库中,以便后续分析或使用。 7. **遵守法规**:在爬取前务必了解目标网站的robots.txt协议,并尊重版权,不要滥用抓取数据。 由于学习通的具体结构和API可能会有所变化,实际操作时可能需要查阅文档或网站源码。遇到具体问题时,可以提供更具体的网址或错误信息寻求帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值