利用Python爬取工控行业系统漏洞

最新推荐文章于 2024-04-12 10:42:15 发布

Python编程KK

最新推荐文章于 2024-04-12 10:42:15 发布

阅读量700

点赞数

文章标签： Python 后端 Python开发 Python基础编程语言

本文链接：https://blog.csdn.net/meiguanxi7878/article/details/101564097

版权

先贴连接，让各位观众老爷看看，对不对你们的胃口

工控行业系统漏洞

可以看到，这个网页是html静态的，所以问题变的非常的简单

只需要用request请求网页就可以了

话不多说，直接贴代码

import requests
from urllib.parse import urlencode
from lxml import etree
import pymysql
import time
import xlwt
import xlrd

def makeurl():
    # http://ics.cnvd.org.cn/?tdsourcetag=s_pctim_aiomsg&max=20&offset=0
    baseurl = 'http://ics.cnvd.org.cn/?'
    params = {
        'tdsourcetag': 's_pctim_aiomsg',
        'max': '20'
    }
    for page in range(MAX_PAGE):
        params['offset'] = page * 20
        url = baseurl + urlencode(params)
        print('url is ', url)
        yield url

def get_page_urllist(url):
    headers = {
        'Host': 'ics.cnvd.org.cn',
        'Referer': 'http://ics.cnvd.org.cn/?tdsourcetag=s_pctim_aiomsg&max=20&offset=40',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
    }
    response = requests.get(url, headers=headers)
    return response.text

def parse_urllist(content):
    html = etree.HTML(content)
    for li in html.xpath('//tbody[@id="tr"]/tr'):
        yield li.xpath('td/a/@href')[0]

def get_page(url):
    headers = {
        'Host': '

最低0.47元/天解锁文章

Python编程KK

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
利用Python爬取工控行业系统漏洞

先贴连接，让各位观众老爷看看，对不对你们的胃口工控行业系统漏洞可以看到，这个网页是html静态的，所以问题变的非常的简单只需要用request请求网页就可以了话不多说，直接贴代码import requestsfrom urllib.parse import urlencodefrom lxml import etreeimport pymysqlimport timeimpo...
复制链接

扫一扫