Python爬虫教程：如何爬取教育漏洞报告平台中的漏洞报告？

最新推荐文章于 2024-03-20 11:11:45 发布

狗蛋的博客之旅

最新推荐文章于 2024-03-20 11:11:45 发布

阅读量922

点赞数

分类专栏：想要学习Python脚本编写？这个专栏将完美满足你的需求文章标签： python 开发语言

本文链接：https://blog.csdn.net/weixin_43263566/article/details/130915096

版权

想要学习Python脚本编写？这个专栏将完美满足你的需求专栏收录该内容

41 篇文章 55 订阅 ¥19.90 ¥99.00

订阅专栏

部分数据来源：ChatGPT

引用

在本教程中，我们将使用 Python 语言和 requests、lxml 库来分析和爬取教育漏洞报告平台的数据。

1. 爬取网站数据

首先，我们需要从教育漏洞报告平台上获取需要的数据。我们可以通过 requests 库向特定网址发送请求，获取响应内容。

import requests

url = 'https://src.sjtu.edu.cn/list/?page=1'
response = requests.get(url)
html_content = response.content

在代码中，requests.get() 方法用于向指定的 URL 发送 GET 请求，返回一个 Response 对象。然后，我们可以通过 response.content 属性获取响应的 HTML 内容。

2. 解析 HTML 文档

获取到 HTML 文档后，我们需要从中提取出我们需要的数据。这里我们使用 lxml 库的 etree 模块。

from lxml import html

html_dom = html.fromstring(html_content)
results = html_dom.xpath('//td[@class="am-text-center"]/a/text()')</

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

狗蛋的博客之旅

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python爬虫教程：如何爬取教育漏洞报告平台中的漏洞报告？

Python爬虫教程：如何爬取教育漏洞报告平台中的漏洞报告？
复制链接

扫一扫

专栏目录

订阅专栏

爬虫python漏洞群_python爬取cnvd漏洞库信息的实例

weixin_39746382的博客

12-17

706

今天一同事需要整理http://ics.cnvd.org.cn/工控漏洞库里面的信息，一看960多个要整理到什么时候才结束。所以我决定写个爬虫帮他抓取数据。看了一下各类信息还是很规则的，感觉应该很好写。but这个网站设置了各种反爬虫手段。经过各种百度，还是解决问题了。设计思路：1.先抓取每一个漏洞信息对应的网页url2.获取每个页面的漏洞信息# -*- coding: utf-8 -*-impor...

python爬取cnnvd漏洞脚本

05-24

python爬取cnnvd漏洞脚本,注释详尽

参与评论您还未登录，请先登录后发表或查看评论

python漏洞扫描器爬虫_Python系列之——漏洞平台厂商列表爬虫

weixin_39631951的博客

12-10

3731

作者:奶权大牛们请跳过哈我相信看这篇文章的有绝大一部分都玩漏洞平台吧大部分人挖洞都是去漏洞平台的厂商列表找目标然后放进扫描器各种扫但是一个个将厂商的站点复制出来就太麻烦了于是爬虫在这个时候又起了作用了以漏洞银行为例子我们先来分析一下接口在访问厂商列表的时候有一个Ajax请求展开来看确实是站点信息每个索引里面的data数组(json)存放的是站点的信息 status数组(json)中的pause...

国内漏洞提交平台

阿大撒大撒的博客

12-26

2320

可在搜索引擎内进行搜索，关键词为:安全应急响应中心、SRC、众测、漏洞平台等。

Python爬虫：查国家安全信息库

VM_Alike的博客

08-14

3046

本博客仅用于技术讨论，若有侵权，联系作者删除。这次笔者想对国家信息安全漏洞库进行爬虫，获取漏洞信息。并将每一个漏洞信息存为一个json文件。一、获取当前总页数先获取总页数，以便进行for循环爬所有的漏洞数据： #获取当前总页数 def get_all_page(): global all_page req = requests.get('http://www.cnn...

python爬取cnvd漏洞库信息的实例

01-01

所以我决定写个爬虫帮他抓取数据。看了一下各类信息还是很规则的，感觉应该很好写。 but这个网站设置了各种反爬虫手段。经过各种百度，还是解决问题了。设计思路： 1.先抓取每一个漏洞信息对应的网页url 2.获取每...

python爬取漏洞库.zip

12-23

总结起来，"python爬取漏洞库.zip"是一个综合性的项目，涉及到Python爬虫技术、数据库操作和GUI设计等多个方面。通过学习和实践这个项目，可以提升对网络漏洞管理的理解，以及Python编程和数据处理的能力。同时，也...

毕业设计：Python web漏洞挖掘技术实现与研究（源码 + 数据库 + 说明文档）

06-10

毕业设计：Python web漏洞挖掘技术实现与研究（源码 + 数据库 + 说明文档） 2 Web应用程序漏洞检测技术 3 2.1 网络爬虫 3 2.1.1 网络爬虫原理 3 2.1.2 爬取策略 3 2.1.3 Scrapy爬虫架构 4 2.2 SQL注入漏洞 4 2.3 XSS...

p86 SRC挖掘-教育行业平台&规则&批量自动化

weixin_43263566的博客

03-30

1793

p86 SRC挖掘-教育行业平台&规则&批量自动化

edusrc教育src漏洞平台

03-01

8448

听说2022年度前十会有证书，这不得冲一波

python3利用爬虫从https://cve.mitre.org网站获取漏洞信息

ronnie88597的博客

11-12

1183

python3利用爬虫从https://cve.mitre.org网站获取漏洞信息 import requests from bs4 import BeautifulSoup import logging logging.basicConfig(level=logging.INFO, # 设置日志级别 format='%(asctime)s - %(filename)s(%(lineno)d)[%(levelname)s]: %(message)s') head

FastAPI（48）- 自定义响应之 HTMLResponse、PlainTextResponse

qq_33801641的博客

10-03

2088

背景上一篇文章讲了通过 Response 自定义响应，但有一个缺点如果直接返回一个 Response，数据不会自动转换，也不会显示在文档中这一节开始讲自定义响应会讲解多个响应类型 JSONResponse HTMLResponse、PlainTextResponse ORJSONResponse、UJSONResponse RedirectResponse StreamingRes...

python爬虫编码问题_python3爬虫编码问题

weixin_39699070的博客

12-13

481

使用爬虫爬取网页经常遇到各种编码问题，因此产生乱码今天折腾了一天，全部总结一遍环境：win10,pycharm,python3.41.首先先来网页编码是utf-8的：以百度首页为例：使用requests库import requestsurl="http://www.baidu.com"response = requests.get(url)content = response.textprint(...

python爬虫——Requests基础

第一楼主的博客

10-19

1409

1、requests 的安装如果本地 Python 环境没有安装 requests，可以在命令提示符窗口输入命令pip install requests，安装 requests 模块，如下图所示。 2、requests 的常用方法 1、GET方法 res = requests.get(url, params=params, headers=headers) 参数说明 url ：需要抓取的 URL 地址； params : 网址带参请求的方法，字典类型； headers : 请求头。以

SRC漏洞挖掘技巧（0基础入门到精通），只要收藏这一篇就够了！！

热门推荐

qq1140037586的博客

09-12

1万+

作为刚接触渗透的小伙伴儿肯定都想快速挖到漏洞提交平台获取注册码，或者想获取更多积分换取证书，这篇文章就是为了帮助各位师傅们快速上手挖取教育src。

对学校网站的爬虫并将数据存储到数据库中

sydney__的博客

07-17

1189

实验室布置了一个任务是爬取学校网站综合新闻部分所有新闻的标题作者存储到数据首先是爬虫部分 import requests from bs4 import BeautifulSoup import time for i in range(32240,31000,-1): #由于学校新闻url的特殊性，我们从id32240向前进行爬取（id最开始的几个已经找不到所以从后向前）...

使用Python爬虫来爬取CNNVD漏洞信息

06-12

您可以使用Python中的requests库和BeautifulSoup库来爬取CNNVD漏洞信息。以下是一个简单的示例代码： ```python import requests from bs4 import BeautifulSoup # 设置请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'} # 构造请求url url = 'http://www.cnnvd.org.cn/web/vulnerability/querylist.tag' # 构造请求参数 params = { 'pageno': 1, # 页码 'repairLd': '', # 修复状态 'keyword': '', # 搜索关键字 'orderBy': 'a', 'orderSc': 'desc' } # 发送请求 response = requests.get(url, headers=headers, params=params) # 解析网页 soup = BeautifulSoup(response.text, 'html.parser') # 获取漏洞列表 vulnerability_list = soup.find_all('tr', {'class': 'tr1'}) # 打印漏洞信息 for vulnerability in vulnerability_list: name = vulnerability.find('a').text.strip() cve = vulnerability.find('span', {'class': 'label label-warning'}).text.strip() publish_date = vulnerability.find_all('td')[3].text.strip() print('漏洞名称：', name) print('CVE编号：', cve) print('发布日期：', publish_date) print('---------------------------------------------') ``` 该代码会爬取第一页的CNNVD漏洞信息，并打印漏洞名称、CVE编号和发布日期。您可以通过修改请求参数来爬取更多的漏洞信息。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交