python 多进程批量扫描网站备份文件

最新推荐文章于 2024-01-06 10:16:29 发布

天眼1

最新推荐文章于 2024-01-06 10:16:29 发布

阅读量705

点赞数

分类专栏： python 扫描批量扫描文章标签： python 多进程 url

本文链接：https://blog.csdn.net/qq_39650046/article/details/110429544

版权

python 同时被 3 个专栏收录

4 篇文章 1 订阅

订阅专栏

扫描

2 篇文章 0 订阅

订阅专栏

批量扫描

2 篇文章 0 订阅

订阅专栏

用python写了一个多进程批量扫描网站备份文件的小脚本
先把要扫描的url放到文件里，通过读取文件里面的url，批量扫描备份文件
这里利用了多进程模块，速度非常可观

import requests
import re
import multiprocessing

list = ['wwwroot.rar','wwwroot.zip','新建文件夹.rar','新建文件夹.zip','www.rar','www.zip','web.rar','web.zip']
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0'}

content_type = ['application/x-rar','application/x-gzip','application/zip','application/octet-stream','application/x-7z-compressed']

def main(i):
	url1 = i.strip('\n')
	c = re.findall(r'https?://(?:[-\w.]|(?:%[\da-fA-F]{6}))+',url1)
	url2 = (',').join(str(x) for x in c) 
	for i in list:
		try:
			b = url2 +'/'+ i
			r = requests.head(url = b ,headers = headers)
			if r.headers['Content-Type'] in content_type:
				with open (r'存放存在的网站的路径','a', encoding ='utf-8' ) as f:
					a = f.write('存在备份文件'+ '：' + b + '\n')
			else:
				print('不存在'+b)
		except:
			print('无法连接')

if __name__ == '__main__':
	p = multiprocessing.Pool(50)#线程数
	with open(r'读取url路径','r',encoding = 'utf-8') as f:
		a = f.readlines()
		for i in a:
			p.apply_async(main,(i,))
	p.close()
	p.join()

天眼1

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python 多进程批量扫描网站备份文件

用python写了一个多进程批量扫描网站备份文件的小脚本先把要扫描的url放到文件里，通过读取文件里面的url，批量扫描备份文件这里利用了多进程模块，速度非常可观import requestsimport reimport multiprocessinglist = ['wwwroot.rar','wwwroot.zip','新建文件夹.rar','新建文件夹.zip','www.rar','www.zip','web.rar','web.zip']headers = {'User-Agen
复制链接

扫一扫