python爬取某SRC网站的漏洞标题

Cookie16688

已于 2022-07-07 14:32:48 修改

阅读量253

点赞数

分类专栏： python 文章标签： python

于 2022-07-07 10:07:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36888745/article/details/125653210

版权

python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

python爬取某SRC网站的漏洞标题

免责申明

由于传播、利用文章内的相关技术从事非法测试，如因此产生的一切不良后果与文章作者无关。

版本说明

(1)某src标题提取。
(2)可用于信息收集。

'''
版本：V1.0
    (1)某src标题提取
    (2)可用于信息收集
    
免责申明：由于传播、利用文章内的相关技术从事非法测试，如因此产生的一切不良后果与文章作者无关。
'''

import requests,time
from lxml import etree

def edu_list(page):
    for page in range(1,page+1):
        try:
            url='https://src.sjtu.edu.cn/list/?page='+str(page)
            print("--------正在提取第 "+str(page)+" 页----------")
            data=requests.get(url).content
            #print(data)
            soup = etree.HTML(data.decode('utf-8'))
            # print(soup)
            result = soup.xpath('//td[not(@*)]/a/text()')  #//td[not(@*) 是用于匹配所有]
            # print(result)
            results = '\n'.join(result)
            resultss=results.split()
            # print(resultss)
            for edu in resultss:
                print(edu)
                with open(r'src.txt', 'a+',encoding='utf-8') as f:
                    f.write(edu+'\n')
                    f.close()
        except Exception as e:
            time.sleep(0.5)
            pass

if __name__ == '__main__':
    edu_list(10)

运行截图

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬取某SRC网站的漏洞标题

(1)某src标题提取。(2)可用于信息收集。
复制链接

扫一扫

专栏目录

Cookie16688 CSDN认证博客专家 CSDN认证企业博客

码龄8年

47: 原创

54万+: 周排名

94万+: 总排名

8万+: 访问

: 等级

1121: 积分

12: 粉丝

45: 获赞

4: 评论

109: 收藏

私信

关注

热门文章

分类专栏

最新评论

C程序为什么最后要加一个return 0
ooosssJU: 非常清晰，nice
KMP算法详解+可运行C程序（每行注释，超详细）
Cookie16688: computeLPS 是一个函数，用于计算模式串的最长公共前缀和后缀的数组，即 LPS 数组。LPS 数组的定义是：对于模式串 pat，lps[i] 表示 pat[0...i] 的最长公共前缀和后缀的长度。在 KMP 算法中，通过计算 LPS 数组，可以在匹配失败时，将模式串的指针向后移动尽可能远的位置，从而提高算法的效率。具体地，当在文本串中查找模式串时，如果当前匹配失败，那么将模式串的指针调整到 LPS 数组中记录的次长公共前缀和后缀的长度，从而跳过已经匹配过的部分，继续进行匹配。在示例程序中，computeLPS 函数接受三个参数，分别是模式串 pat，模式串的长度 M，以及一个用于存储 LPS 数组的数组 lps。该函数的具体实现是一个循环，逐个计算每个前缀的 LPS 值。在每次循环中，首先判断当前字符和前缀的下一个字符是否相同，如果相同，则更新当前前缀的最长公共前缀和后缀的长度，并记录在 LPS 数组中。如果不同，则从 LPS 数组中获取当前前缀的次长公共前缀和后缀的长度，并将前缀的指针向前移动。最后，返回计算出的 LPS 数组。
java中继承的小例子
编译人生007: 运行结果为什么是空白的？因为没赋值吗？
get（），set（）方法的测试（含有私有的属性）
小二同学甜甜哒: 为什么不写那个获取私有属性的方法也可以得到正常运行结果

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。