【Python】多个网页中，寻找每个网页都出现过的关键词

最新推荐文章于 2022-06-14 10:50:27 发布

浪子燕青啦啦啦

最新推荐文章于 2022-06-14 10:50:27 发布

阅读量2.8k

点赞数 1

分类专栏： Python 原创作品文章标签： python jieba 相同元素相同关键词

本文链接：https://blog.csdn.net/lzy98/article/details/80078232

版权

前言

有些时候做漏洞验证的时候，需要统计漏洞页面有哪些特征码(比如svn这个词在这些网页中出现了多少次)，手动的话不仅慢还浪费精力，于是用二十行代码实现寻找多个网站中出现的相同元素次数。

涉及知识点

jieba分词
collection的Counter
Pretty格式化输出

工程逻辑

代码实例

import sys
import jieba
import random
import requests
from collections import Counter
from prettytable import PrettyTable
import time
import os
reload(sys)
sys.setdefaultencoding('utf-8')

搜索引擎分词

ll=[]
def scan(url):
    try:
        r = requests.get(url=url, headers=headers, timeout=5).content.decode("utf8","ignore").encode("gbk","ignore")
        for x in jieba.cut_for_search(r,HMM=True):
            ll.append(x)
    except Exception, e:
        print e

导入扫描网址并扫描分词

url_input = raw_input(unicode('请输入需要扫描的网址文本:','utf-8').encode('gbk'))
list_url = list(set([i.replace('\n','') for i in open(url_input,'r').readlines()]))
for url in list_url:
    print 'Scan: '+(url)
    scan(url)
</

最低0.47元/天解锁文章

浪子燕青啦啦啦

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
【Python】多个网页中，寻找每个网页都出现过的关键词

前言有些时候做漏洞验证的时候，需要统计漏洞页面有哪些特征码(比如svn这个词在这些网页中出现了多少次)，手动的话不仅慢还浪费精力，于是用二十行代码实现寻找多个网站中出现的相同元素次数。涉及知识点jieba分词collection的CounterPretty格式化输出工程逻辑代码实例import sysimport jiebaimport random...
复制链接

扫一扫