【python】提取一个网站带有参数的url，然后随机选取几个保存到本地+源码分析

最新推荐文章于 2024-07-14 03:17:54 发布

浪子燕青啦啦啦

最新推荐文章于 2024-07-14 03:17:54 发布

阅读量1.6k

点赞数

分类专栏： Python 原创作品

本文链接：https://blog.csdn.net/lzy98/article/details/54695842

版权

该博客介绍了如何使用Python的requests和BeautifulSoup库从网站中提取带参数的URL，特别是asp、php、aspx和jsp链接。通过读取url列表，对每个URL进行HTTP请求，然后筛选出包含'http'的URL，将其存储到不同的列表中。利用random库随机选取部分URL，将其写入到本地文件url.txt中，用于潜在的SQL注入检测。

摘要由CSDN通过智能技术生成

逐行读取url，然后bs4提取a标签内的文字，在建立两个列表，一个append（）不停载入url，然后做分析，存在http就先写入本地。然后用random模块，随机选择几个要用的写入~~~

关于random库，基本使用方法如下

import random
list = [1,2,3,4,5,6,7,8,9]
sss = random.sample(list,6)
print sss

源代码如下~

#coding = utf-8
import re
import requests
import time
from bs4 import BeautifulSoup as asp
import random
headeraa = {'User-Agent': 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)',}

hansb = open('urllist.txt','r') #将url放进urllist.txt
hanssb = hansb.readlines()
hansb.close()
print hanssb
zhzhzh = open('url.txt','a+') #开始写入

<

最低0.47元/天解锁文章

浪子燕青啦啦啦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【python】提取一个网站带有参数的url，然后随机选取几个保存到本地+源码分析

逐行读取url，然后bs4提取a标签内的文字，在建立两个列表，一个append（）不停载入url，然后做分析，存在http就先写入本地。然后用random模块，随机选择几个要用的写入~~~
复制链接

扫一扫