python爬取网页表格_利用Python爬取fofa网页端数据

最新推荐文章于 2024-01-18 07:54:56 发布

weixin_39613089

最新推荐文章于 2024-01-18 07:54:56 发布

阅读量128

点赞数

文章标签： python爬取网页表格

安装环境：

pip install requests

pip install lxml

pip install fire

使用命令：

python fofa.py -s=title="你的关键字" -o="结果输出文件" -c="你的cookie"

代码如下：

import requests,time,base64,fire

from lxml import etree

def fofasc(s,o,c):

try:

sbase64 = (base64.b64encode(s.encode(‘utf-8‘))).decode(‘utf-8‘)

cookies = {

"_fofapro_ars_session": c

}

headers = {

‘User-Agent‘: ‘Mozilla/5.0 (Linux; Android 7.1.2; PCRT00 Build/N2G48H; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/66.0.3359.158 Safari/537.36 fanwe_app_sdk sdk_type/android sdk_version_name/4.0.1 sdk_version/2020042901 screen_width/720 screen_height/1280‘,

}

for i in range(1,1000):

url = "https://www.fofa.so/result?q="+s+"&qbase64="+sbase64+"&full=true&page="+str(i)

r = requests.get(url, headers=headers, cookies=cookies)

soup = etree.HTML(r.text)

result = soup.xpath(‘//*[@id="ajax_content"]/div/div/div/a/text()‘)

print(result)

if result != []:

for rs in result:

with open(o,mode="a+") as f:

f.write(rs+"\n")

else:

print("已经获取不到任何数据，爬取完毕！")

break

time.sleep(2)

except KeyboardInterrupt:

print(‘用户退出‘)

if __name__ == ‘__main__‘:

fire.Fire(fofasc)

原文地址：https://www.cnblogs.com/aptkekeo/p/13288726.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39613089

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬取网页表格_利用Python爬取fofa网页端数据

安装环境：pip install requestspip install lxmlpip install fire使用命令：python fofa.py -s=title="你的关键字" -o="结果输出文件" -c="你的cookie"代码如下：import requests,time,base64,firefrom lxml import etreedef fofasc(s,o,c):try:...
复制链接

扫一扫

基于Python爬取fofa网页端数据过程解析

09-16

在本文中，我们将深入探讨如何使用Python编程语言来爬取FOFA（网络空间安全搜索引擎）的网页端数据。FOFA是一个强大的工具，它允许用户搜索全球互联网上的资产信息，包括漏洞分析、应用分布统计和流行度评估。下面...

FOFA数据采集工具

RestoreJustice的博客

04-01

1721

这个工具基于python实现，使用爬虫获取数据，有爬虫模式和api模式两种模式，对于有api使用权限的用户可以使用api模式这会更加高效，对于没有FOFA API使用权限的用户可以使用爬虫模式，使用爬虫模式需要提供用户自己的cookie。还可以对FOFA收集的url进行POC验证，并将采集的数据保存为文件。使用爬虫模式和多线程验证POC的时候由于程序请求频繁消耗较大UI会有轻微卡顿的情况，不会影响实际采集、验证速度。

参与评论您还未登录，请先登录后发表或查看评论

python自动化挖掘、爬虫

weixin_58782362的博客

12-19

272

第一个是edu的爬取。

p77 Python 开发-批量 Fofa&SRC 提取&POC 验证

weixin_43263566的博客

03-07

1580

Python 开发-批量 Fofa&SRC 提取&POC 验证

python安全开发——Fofa结果、POC批量提取验证&教育SRC

qi_SJQ_的博客

02-23

2679

1.概述：涉及技术：Request 爬虫技术，lxml 数据提取，异常护理，Fofa 等使用说明。目的：掌握和利用公开或者 0day漏洞进行批量化的收集和验证脚本开发。 2.某漏洞 POC 验证脚本： requests库使用参考：https://docs.python-requests.org/en/latest/ 首先拿一个简单的例子：验证是否存在 glassfish 任意文件读取漏洞。过程：验证存在 glassfish 的应用是否存在任意文件读取漏洞：两个 poc，分别对应 linu.

fofa自动化爬虫脚本更新+详解

weixin_50464560的博客

04-04

970

fofa自动化爬虫脚本更新+详解起因最近要用到fofa爬虫，为什么要用爬虫不用api，问就是穷，想起来之前写过一个相关的脚本：Fofa-python-脚本，是很久以前写的了，之前写的时候有点问题，昨天重新修改了一下，记录一下整个过程关于fofa 在其他大佬博客上摘抄的FOFA简介及使用教程 FOFA 是白帽汇推出的一款网络空间搜索引擎,它通过进行网络空间测绘,能够帮助研究人员或者企业迅速进行网络资产匹配,例如进行...

爬取Fofa搜索引擎搜索到的信息，然后输出到Csv中

02-23

Fofa_Csv 爬取Fofa搜索引擎搜索到的信息，然后输出到Csv中。配置：为fofa.py配置Email & Key & search_size(根据会员等级配置) 用法：在jiangnan.txt中创建需要查询的信息(单条可以是组合查询) 运行fofa.py 脚本...

基于Python的电商数据爬虫实战设计源码

04-07

支持淘宝商品、微信公众号、大众点评、闲鱼、阿里任务、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集和汽车之家等网站的数据爬取，以满足用户在数据采集...

基于Python的电商数据爬虫实战项目设计源码

最新发布

04-19

本源码为基于Python的电商数据爬虫实战项目设计，共包含380个文件，其中py文件128个，gif文件75个，md文件41个，js文件27个，csv文件22个，json文件18个，html文件18个，txt文件10个，jpg文件10个，png文件8个。...

自己用python写的一款fofa api爬取工具

qq_39650046的博客

03-13

1248

自己用python写的一款fofa api爬取工具，支持csv格式一键导出输出邮箱，key就可以爬取了，数量看会员等级导出，只需要输入文件名就可以，然后点击导出csv，输出存在URL，ip,端口，网站名称等，更加方便查看，需要的可以点以下链接去下载 https://download.csdn.net/download/qq_39650046/15763758 ...

fofa资产收集-python爬虫

安于心，修于形

05-12

1444

在使用fofa进行搜索资产时，使用api接口调用进行提取时是有限制的，那提取上限怎么办？一个一个负责出来吗？当然不是，而是需要一个无限制爬取的脚本.fofa_token在F12-cookie当中查找复制即可。result.txt是ipf.txt去重后的结果。后面的页数若是（1，5）那便是提取1页到5页.其中search_data填写搜索关键词。ip.txt提取的为原始内容结果如下。ipf.txt提取的为原始内容的IP。

fofa稳定爬虫——可视化

渗透测试

11-14

4029

前几天在批量测试漏洞，前提是需要有大量的url（例如教育网站的url），但是用了网上一些开源的爬虫后，都不是很理想，有的还需要自己二次开发。所以趁着周末，就使用python的pyQT5插件开发一款可视化爬虫软件目标地址：fofa搜索（主要是页面干净，好用，一次能搜索上万条数据）防止反爬： user-agent：设置指定user-agent头或者随机头 ip地址： x-forwarded-for：简单的头ip地址代理池：牛批的随机更换ip地址（可以支持快代理） referer：开启同源

【python爬虫】爬取fofa信息（随机User-Agent+获取并携带Cookie+获取并携带csrf_token访问）

AA8j的博客

03-18

1342

本模块为IP溯源单线程获取fofa信息的模块。效果图代码 import re import base64 import urllib.request # 发送请求 import http.cookiejar # cookie from urllib import parse from fake_useragent import UserAgent def get_fofa_html(ip): url1 = f"https://fofa.so/result?q=ip='{ip}'&amp

Python 实战：爬虫抓取网站数据处理后存入Excel表

热门推荐

pwy1198156945的专栏

12-30

1万+

项目场景： Python是我接触过的，相比C++、java，是一门非常简单的编程语言。对于办公室白领，在未来是一门必须掌握的技巧，可以帮你自动化处理数据。废话少说，上干货! 本期主要给大家分享一个我工作中的一次使用，希望对你以后工作有所帮助，提高效率，解放劳动力。问题描述：我们需要在一个网站上对网站上所有的要素，进行逐一检查，1W多要素看的人眼花缭乱，效率慢，易出错。处理办法：python 在网站爬取所有要素，程序中加入判断规则，输出成Excel表格。原来3天的工作量，现在1min内搞定.

python抓取网页内容到excel,python如何抓取网页数据

www55597的博客

01-18

2441

记录一下使用python将网页上的数据写入到excel中由于我这边的业务需要去除两个网站中相同的手机号，所以做了一些处理。java程序员第一次接触python，大家可以根据自己的需求修改里面具体的业务逻辑。

Python爬虫爬取Fofa中的url

weixin_50464560的博客

03-19

1087

Python3爬虫爬取Fofa中的urlPython3爬虫实战F5 BIG-IP TMUI(CVE-2020-5902)远程代码执行漏洞一、漏洞简述 F5 BIG-IP 是美国F5公司一款集成网络流量管理、web应用防火墙、web网关、负载均衡等功能的应用交付平台。前不久F5官方公布了在流量管理用户界面（TMUI）配置实用程序的特定页面中存在一处远程代码执行漏洞。攻击者可以利用该漏洞构造恶意请求，造成任意Java 代码执行，进而控制 F5 BIG-IP 的全部功能，包括但不限于: 执行任意系统命令、开启

fofa采集脚本基于(phantomjs+selenium)

刺客python

06-05

2661

新手浏览器自动化练习项目:脚本运行: 数据库保存: 脚本连接: https://github.com/huayanqiaq/fofa_spider

python 爬取网页请求，并生成表格（简单demo）

weixin_42289080的博客

07-21

1942

使用python语言爬取网络请求（requests），并手动处理数据，生成表格(openpyx)

python爬取fofa数据each_dic['ip'] = each[0]

10-19

Python爬取FOFA数据的示例代码中的each_dic['ip'] = each[0] 表示将FOFA数据中每个元素的第一个值赋值给字典 each_dic 的 'ip' 键。在使用 Python 爬取 FOFA 数据时，我们通常会通过编写代码来获取所需的数据，并...