2018年04月_浪子燕青啦啦啦

原创【python】打造一款自动扫描全网漏洞的扫描器

这是一款和刘老师一起写的网安类别扫描器。基本原理是由Python+Mysql搭建的扫描器，实现自动无限永久爬行采集网站链接，自动化漏洞扫描检测。目的是挂机就能实现自动化发掘敏感情报，亦或是发现网站的漏洞或者隐藏可利用的漏洞。早在17年11月份的时候就有这个想法，可是一直没有去做，后来快到除夕前几天才正式开始整个软件工程的设计。当时的想实现的功能比较简单，就是能做到无限采集到网站使用的CM

2018-04-25 14:22:30 23849 51

原创【python】生成器与生成可迭代对象

生成器主要能节省内存，每次都是制造一个元素然后返回这个原始，主要用法包括用()和yield生成。构造生成器对象如下就是一个生成器，和迭代器对象用法相似，使用next()获取下一个元素。data_list=(i for i in range(10))print data_list.next()函数中只要有yield，这个函数就会变成生成器。每次运行到yield的时候，函数会暂停，并且保存当前的运行

2018-04-25 14:23:10 339

原创【python让多个字符串居中对齐

import sysimport randomreload(sys)sys.setdefaultencoding('utf-8')案例一使用ljust()方法左对齐，其中括号内可以接受两个参数，字符串长度和用什么填充，比如ljust(10,’-‘)就是10个长度，剩余的地方用符号-来填满。rjust()是右对齐，center()是居中对齐，说教无益，上代码。data_text='langzi

2018-04-25 14:22:09 11129

原创【python】批量验证网站CMS类型

CMS识别方式页面关键词验证比如我打开www。langzi。fun这个网站，返回的页面源代码里面有个关键词，根据字典判断是hexo搭建的网站，于是把www。langzi。fun保存在文件夹下的hexo.txt文本中。比如字典判断键值是否在返回的页面内容中，如果匹配成功则写入本地。robots.txt文件内容识别很多网站的robots文件中都有该网站CMS的关键词，所以访问网站

2018-04-25 14:17:26 1855 2

原创【python】扫描备份文件以及源码泄露

设计初衷灵感来自于某个小哥在群里闲聊的时候，谈及自己一起提交过一个知名网站分站的源码泄露，并且收益不菲，我当时一愣，没想到源码泄露这个漏洞还能赚不少积分，于是研究一番后，决定写一个专门扫描网站重点敏感信息泄漏的软件，这个软件的功能包括这三点。扫描备份文件扫描SVN/GIT源码泄漏扫描WEBINFO页面信息泄漏虽然只是三点简单的功能，但是拆开后来说，涉及到的知识点有点杂。所以写

2018-04-25 14:15:46 5118 2

原创【python】递归函数

递归定义递归函数：这个函数在他的内部调用了自身。函数自己调用自己，实现递归。递归特性： 1. 记住所有的递归函数都有一个退出条件 2. 相邻两次重复之间有紧密的联系，前一次要为后一次做准备（通常前一次的输出就作为后一次的输入）。 3. 递归效率不高，递归层次过多会导致栈溢出（在计算机中，函数调用是通过栈（stack）这种数据结构实现的，每当进入一个函数调用，栈就会加一层栈帧，每当函数返回，栈就

2018-04-25 14:11:25 629

原创【Python】装饰器

装饰器：在不改变原有代码的情况下，为被装饰的函数,类,以及对象等添加新的功能，或者帮助打印输出。Python的执行是从上往下顺序执行，遇到函数的时候不会立刻执行，只有函数被调用的时候才会执行函数的代码。但是写代码要遵循开发封闭原则，虽然在这个原则是用的面向对象开发，但是也适用于函数式编程，简单来说，它规定已经实现的功能代码不允许被修改，但可以被扩展，即：封闭：已实现的功能代码块开放：对扩展开发

2018-04-25 14:10:36 268

原创【Python】变量作用域

作用域这个概念在Python面试中经常会有提及，特在此做个笔记总结。稍微引申一下闭包的概念，以及一点面试中可能会触及的知识点。作用域作用域：在作用域的内部可以访问这个变量，但是在外部没办法访问这个作用域里面的变量。Python中，函数的作用域是最低级的作用域，函数内部的变量只能在函数内部起作用。python的四层作用域 1. 局部作用域 2. 闭包函数外的函数中 3. 全局作用域 4. 内建

2018-04-25 14:09:21 288

原创【python】迭代器与可迭代对象

迭代器主要有两个方法next()与iter()，next不断返回下一个元素，知道元素全部返回后出现异常，可以节省内存空间。iter是迭代，可以把一个列表直接转换成迭代器，然后使用next()方法。data_list=[1,2,3,4,5]data_list=iter(data_list)print next(data_list)print next(data_list)print ...

2018-04-25 14:04:10 241

原创【Python】分割拆分文本字符串

主要是使用字符串的split()与正则的re.split()方法进行拆分。前者每次处理一种分隔符，后者一次性可以处理多个分割字符。import sysimport rereload(sys)sys.setdefaultencoding('utf-8')data_text='''shuob1uShang，why，943586926isM1?YEAH。SUre，iamis、now i ...

2018-04-25 14:03:13 16451

原创【python】函数传参笔记

普通传参的小坑def test(a=[]): a.append('A') return aprint test()print test()print test()返回的结果：['A']['A', 'A']['A', 'A', 'A']原因：传入的参数是一个空的列表，Python遇到函数的时候会把函数读到内存中，默认参数会被创建。虽然函数没有执行，但是其...

2018-04-25 14:02:27 180

原创【python】字典列表筛选数据

涉及使用filter与匿名函数lambda,列表推导,字典遍历知识。import sysimport randomreload(sys)sys.setdefaultencoding('utf-8')生成列表data_list=[random.randint(1,100) for _ in range(10)]//randint是在数值中随机选择一个，从1-100选择10个数字...

2018-04-25 14:01:42 8135

原创【python】按照字典的值进行排序

循环遍历字典的时候，遍历对象都是字典的键，做对比的时候对比的也是字典的键，如果想要对比字典的值呢？上一篇文章有说到字典的.items()|.keys()|.values()的使用。此篇记述按照字典的值的大小进行排序。import sysimport randomreload(sys)sys.setdefaultencoding('utf-8')目标{'chen': ...

2018-04-25 14:00:41 1134

原创【Python】统计序列中元素出现次数

import sysimport randomfrom collections import Counterreload(sys)sys.setdefaultencoding('utf-8')使用字典方式统计元素出现次数生成列表data_list=[random.randint(1,20)for _ in range(10)]//从1-20随机选择10个数字...

2018-04-25 13:59:50 2982

原创【Python】批量扫描检测网址SQL注入点

流程图首先需要爬行该网站，获取到网站链接，然后再对这些链接进行检测，最后结果保存在本地。工程设计爬行链接惭愧，并没有用详细的正则表达式专门提取链接。使用的是寻找Href的值，然后剖去http与javascript。将爬行的结果保存在列表，因为可能一次性可能爬很多的链接，没有必要检测这么多的链接，所以最后做了一些筛选，只随机选择5个链接进行检测。 r...

2018-04-25 13:58:57 7745

原创【Python】jieba分词常用方法

结巴分词三种模式支持3中分词模式：1.全模式：把句子中的所有可以成词的词语都扫描出来，使用方法：jieba.cut(“字符串”, cut_all=True, HMM=False)2.精确模式：试图将文本最精确的分开，适合于做文本分析。使用方法：jieba.cut(“字符串”, cut_all=False, HMM=True)3.搜索引擎模式：在精确的基础上对长词进行进一步的切分。使...

2018-04-25 13:54:49 4104

原创【Python】多个网页中，寻找每个网页都出现过的关键词

前言有些时候做漏洞验证的时候，需要统计漏洞页面有哪些特征码(比如svn这个词在这些网页中出现了多少次)，手动的话不仅慢还浪费精力，于是用二十行代码实现寻找多个网站中出现的相同元素次数。涉及知识点jieba分词collection的CounterPretty格式化输出工程逻辑代码实例import sysimport jiebaimport random...

2018-04-25 13:52:25 2860

浪子燕青的博客