A Systematic Study on Generating Web Vulnerability Proof-of-Concepts Using Large Language Models

UnknownBody_2

于 2025-12-14 08:15:00 发布

阅读量125

点赞数 3

CC 4.0 BY-SA版权

分类专栏： LLM Daily 文章标签：语言模型安全网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/UnknownBody_2/article/details/155706689

LLM Daily 专栏收录该内容

61 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

在这里插入图片描述

一、文章主要内容总结

1. 研究背景与问题

背景：Web应用漏洞频发，但近半数CVE缺乏可复现的PoC，传统PoC生成工具依赖漏洞代码、专家模板，难以覆盖全披露周期。
核心问题：LLM能否利用公开披露信息（描述、补丁、代码）自动生成有效PoC，且在不同披露阶段（新披露、1-day、N-day）的表现如何。

2. 研究设计

评估对象：2个代表性LLM（GPT-4o、DeepSeek-R1）。
测试集：100个可复现的真实CVE，覆盖5类高危Web漏洞（CWE-78/79/89/352/434）。
披露阶段划分：
- S1（新披露）：仅提供漏洞描述。
- S2（1-day）：提供描述+补丁。
- S3（N-day）：提供描述+补丁+漏洞文件代码。
研究维度：通过4个研究问题（RQ1-4）逐步探索，从基础效果评估→失败原因分析→上下文补充优化→自适应推理优化。

3. 核心研究结果

基础效果（RQ1）：仅用公开信息时，LLM生成有效PoC的成功率为8%-34%，DeepSeek-R1表现

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。