浪子燕青的博客

www.langzi.fun

【python】打造一款自动扫描全网漏洞的扫描器

这是一款和刘老师一起写的网安类别扫描器。基本原理是由Python+Mysql搭建的扫描器,实现自动无限永久爬行采集网站链接,自动化漏洞扫描检测。目的是挂机就能实现自动化发掘敏感情报,亦或是发现网站的漏洞或者隐藏可利用的漏洞。     早在17年11月份的时候就有这个想法,可是一直没有去做,后来快...

2018-04-25 14:22:30

阅读数 9381

评论数 15

【python】生成器与生成可迭代对象

生成器主要能节省内存,每次都是制造一个元素然后返回这个原始,主要用法包括用()和yield生成。构造生成器对象如下就是一个生成器,和迭代器对象用法相似,使用next()获取下一个元素。data_list=(i for i in range(10)) print data_list.next() 函...

2018-04-25 14:23:10

阅读数 128

评论数 0

【python让多个字符串居中对齐

import sys import random reload(sys) sys.setdefaultencoding('utf-8') 案例一使用ljust()方法左对齐,其中括号内可以接受两个参数,字符串长度和用什么填充,比如ljust(10,’-‘)就是10个长度,剩余的地方用符号-来填满。...

2018-04-25 14:22:09

阅读数 2964

评论数 0

【python】批量验证网站CMS类型

CMS识别方式页面关键词验证    比如我打开www。langzi。fun这个网站,返回的页面源代码里面有个关键词,根据字典判断是hexo搭建的网站,于是把www。langzi。fun保存在文件夹下的hexo.txt文本中。比如字典    判断键值是否在返回的页面内容中,如果匹配成功则写入本地。r...

2018-04-25 14:17:26

阅读数 852

评论数 1

【python】扫描备份文件以及源码泄露

设计初衷    灵感来自于某个小哥在群里闲聊的时候,谈及自己一起提交过一个知名网站分站的源码泄露,并且收益不菲,我当时一愣,没想到源码泄露这个漏洞还能赚不少积分,于是研究一番后,决定写一个专门扫描网站重点敏感信息泄漏的软件,这个软件的功能包括这三点。 扫描备份文件 扫描SVN/GIT源码泄漏 扫描...

2018-04-25 14:15:46

阅读数 2271

评论数 0

【python】递归函数

递归定义递归函数:这个函数在他的内部调用了自身。函数自己调用自己,实现递归。递归特性: 1. 记住所有的递归函数都有一个退出条件 2. 相邻两次重复之间有紧密的联系,前一次要为后一次做准备(通常前一次的输出就作为后一次的输入)。 3. 递归效率不高,递归层次过多会导致栈溢出(在计算机中,函数...

2018-04-25 14:11:25

阅读数 360

评论数 0

【Python】装饰器

装饰器:在不改变原有代码的情况下,为被装饰的函数,类,以及对象等添加新的功能,或者帮助打印输出。Python的执行是从上往下顺序执行,遇到函数的时候不会立刻执行,只有函数被调用的时候才会执行函数的代码。但是写代码要遵循开发封闭原则,虽然在这个原则是用的面向对象开发,但是也适用于函数式编程,简单来说...

2018-04-25 14:10:36

阅读数 44

评论数 0

【Python】变量作用域

作用域这个概念在Python面试中经常会有提及,特在此做个笔记总结。稍微引申一下闭包的概念,以及一点面试中可能会触及的知识点。作用域作用域:在作用域的内部可以访问这个变量,但是在外部没办法访问这个作用域里面的变量。Python中,函数的作用域是最低级的作用域,函数内部的变量只能在函数内部起作用。p...

2018-04-25 14:09:21

阅读数 102

评论数 0

【python】迭代器与可迭代对象

迭代器 主要有两个方法next()与iter(),next不断返回下一个元素,知道元素全部返回后出现异常,可以节省内存空间。iter是迭代,可以把一个列表直接转换成迭代器,然后使用next()方法。 data_list=[1,2,3,4,5] data_list=iter(data_list)...

2018-04-25 14:04:10

阅读数 90

评论数 0

【Python】分割拆分文本字符串

主要是使用字符串的split()与正则的re.split()方法进行拆分。前者每次处理一种分隔符,后者一次性可以处理多个分割字符。 import sys import re reload(sys) sys.setdefaultencoding('utf-8') data_text=''' shu...

2018-04-25 14:03:13

阅读数 4732

评论数 0

【python】 函数传参笔记

普通传参的小坑 def test(a=[]): a.append('A') return a print test() print test() print test() 返回的结果: ['A'] ['A', 'A'] ['A', 'A', 'A'] 原因:传入的参数是...

2018-04-25 14:02:27

阅读数 42

评论数 0

【python】字典列表筛选数据

涉及使用filter与匿名函数lambda,列表推导,字典遍历知识。 import sys import random reload(sys) sys.setdefaultencoding('utf-8') 生成列表 data_list=[random.randint(1,100) for...

2018-04-25 14:01:42

阅读数 714

评论数 0

【python】按照字典的值进行排序

    循环遍历字典的时候,遍历对象都是字典的键,做对比的时候对比的也是字典的键,如果想要对比字典的值呢?上一篇文章有说到字典的.items()|.keys()|.values()的使用。此篇记述按照字典的值的大小进行排序。 import sys import random reload(sys...

2018-04-25 14:00:41

阅读数 216

评论数 0

【Python】统计序列中元素出现次数

import sys import random from collections import Counter reload(sys) sys.setdefaultencoding('utf-8') 使用字典方式统计元素出现次数 生成列表 data_list=[random.ra...

2018-04-25 13:59:50

阅读数 1163

评论数 0

【Python】批量扫描检测网址SQL注入点

流程图     首先需要爬行该网站,获取到网站链接,然后再对这些链接进行检测,最后结果保存在本地。 工程设计 爬行链接     惭愧,并没有用详细的正则表达式专门提取链接。使用的是寻找Href的值,然后剖去http与javascript。将爬行的结果保存在列表,因为可能一次性可能爬...

2018-04-25 13:58:57

阅读数 3833

评论数 1

【Python】 打造简单易用的扫描IP代理池

设计流程 采集接口     寻找了3个提供免费代理IP的网站,用正则扣下这些网站提供的代理IP。 1. http://www.66ip.cn 2. http://www.xicidaili.com 3. http://www.kuaidaili.com 代理IP存活验证 ...

2018-04-25 13:57:14

阅读数 1693

评论数 0

【Python】jieba分词常用方法

结巴分词三种模式 支持3中分词模式: 1.全模式:把句子中的所有可以成词的词语都扫描出来,使用方法:jieba.cut(“字符串”, cut_all=True, HMM=False) 2.精确模式:试图将文本最精确的分开,适合于做文本分析。使用方法:jieba.cut(“字符串”, cut_...

2018-04-25 13:54:49

阅读数 348

评论数 0

【Python】多个网页中,寻找每个网页都出现过的关键词

前言 有些时候做漏洞验证的时候,需要统计漏洞页面有哪些特征码(比如svn这个词在这些网页中出现了多少次),手动的话不仅慢还浪费精力,于是用二十行代码实现寻找多个网站中出现的相同元素次数。 涉及知识点 jieba分词 collection的Counter Pretty格式化输出 ...

2018-04-25 13:52:25

阅读数 848

评论数 0

提示
确定要删除当前文章?
取消 删除