- 博客(100)
- 收藏
- 关注
原创 【文献阅读】TrustRAG: Enhancing Robustness and Trustworthiness in Retrieval-Augmented Generation
本文提出TrustRAG框架,针对检索增强生成(RAG)系统面临的语料库投毒攻击问题,提出双阶段防御方案。TrustRAG首先通过聚类分析检测嵌入空间中聚集的恶意文档,结合ROUGE分数进行初步过滤;随后利用大语言模型(LLM)自身知识进行内容一致性校验,智能选择可靠知识源生成最终回答。实验表明,该框架可降低攻击成功率最高达80%,同时提升回答准确率30%,显著优于现有防御方案。TrustRAG作为首个能同时防御单点和多点语料注入攻击的框架,具备即插即用特性,可无缝集成各类开源/闭源语言模型。
2025-12-08 22:06:43
1037
原创 【文献阅读】TrafficLLM: Enhancing Large Language Models for Network Traffic Analysis with Generic Traffic
【原文翻译】基于机器学习(ML)的网络流量分析已被广泛用于威胁检测。然而,此类方法在不同任务和未见数据上的泛化能力非常有限。大语言模型(LLMs)以其强大的泛化能力著称,并在多个领域展现出优异的性能。但由于网络流量具有显著不同的特性,其在流量分析领域的应用受到限制。为解决这一问题,本文提出TrafficLLM,它引入了一个双阶段微调框架,旨在从异构的原始流量数据中学习通用的流量表示。该框架采用流量领域分词双阶段调优流程和可扩展适配。
2025-12-05 22:40:59
840
原创 【文献阅读】Spa-VLM: Stealthy Poisoning Attacks on RAG-based VLM
本文提出首个针对基于RAG视觉语言模型(VLM)的多模态投毒攻击方法Spa-VLM。研究发现,现有单模态RAG投毒攻击在多模态场景下完全失效(失败率100%)。Spa-VLM通过同步构造对抗性图像和误导性文本的恶意条目,在10万和200万规模知识库中仅注入5个恶意条目即可实现超过0.8的攻击成功率,显著优于现有方法。实验表明,当前防御机制均无法有效抵御该攻击,凸显了多模态RAG系统的安全脆弱性。研究揭示了VLM在政治、医疗等关键领域部署时的潜在风险。
2025-11-25 14:59:47
1009
原创 【文献阅读】【RAG攻击综述】Surveying the RAG Attack Surface and Defenses: Protecting Sensitive Company Data
摘要:本文系统研究了检索增强生成(RAG)技术的安全漏洞及其防御措施。随着大语言模型(LLM)在企业应用的普及,RAG因无需微调即可定制模型知识而备受青睐,但其引入的安全风险尚未被充分认知。研究通过文献综述归纳出12类攻击手段(如语料库污染、提示词注入、越狱攻击等),并分析其攻击点(数据语料库、检索器、LLM)。同时梳理了27种前沿防御措施(如知识扩展、提示过滤等),为企业部署RAG提供安全指南。研究填补了RAG攻击面系统化认知的空白,为组织平衡效率提升与数据安全提供决策依据。
2025-11-24 20:02:48
622
原创 【文献阅读】PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in ...
本文提出协同提示-RAG攻击(PR-Attack),通过联合优化知识库投毒文本和提示后门触发器,有效提升基于检索增强生成的大语言模型攻击效果。针对现有方法在投毒文本数量受限时攻击成功率下降、隐蔽性不足等问题,PR-Attack将攻击建模为双层优化问题:上层优化触发器使模型在激活/非激活时分别输出目标/正确答案;下层优化投毒文本以确保其被检索。实验表明,该方法在仅注入少量投毒文本时仍保持高攻击成功率,且不易被检测。这一工作揭示了多组件协同攻击的潜在风险,为提升RAG系统安全性提供了重要启示。
2025-11-16 21:12:30
616
原创 【文献阅读】PoisonedRAG: Knowledge Corruption Attacks to Retrieval-Augmented Generation of Large Language
本文提出PoisonedRAG攻击方法,首次揭示了检索增强生成(RAG)系统中知识数据库的安全漏洞。攻击者通过向知识库注入少量恶意文本(每个目标问题5个),就能诱导LLM对特定问题生成攻击者预设的答案(如错误CEO信息或商业偏见),在黑盒设置下攻击成功率高达97%。研究将攻击建模为优化问题,提出分解恶意文本为两个子部分分别满足检索条件和生成条件的创新方法,并通过实验证明现有防御措施无效,凸显了开发新型防御机制的必要性。这项工作填补了RAG系统安全性研究的空白,为AI安全领域提供了重要警示。
2025-11-16 14:23:13
865
原创 C++中.push_back()和.emplace_back()的比较
和都是 C++ STL 中向容器(如)尾部添加元素的方法,但它们在实现方式和性能上有显著差异。C++ 完美转发深度解析:从入门到精通C++:深入理解移动语义。
2025-09-09 11:36:09
865
原创 anaconda下载与pycharm解析器配置
用pycharm新建一个项目,或打开已有的项目。Type选择Conda。由于我之前没有创建环境,因此,这里选择“Generate new”,即创建一个新环境。点击ok后,便自动创建一个新环境,并切换到该环境。其中,安装包可以直接到官网下载。这样解析器就配置好啦。
2025-09-03 00:01:29
296
原创 靶场搭建记录
本文介绍了phpStudy的下载安装与配置过程,以及Pikachu靶场环境搭建方法。主要内容包括:1)从xp.cn下载phpStudy v8.1版本并完成安装;2)启动Apache和MySQL服务,配置MySQL环境变量;3)从GitHub下载Pikachu靶场文件,部署到phpStudy的WWW目录;4)修改数据库配置文件并初始化安装。通过127.0.0.1访问确认配置成功,为后续Web安全测试提供了本地实验环境。整个过程详细说明了软件安装、服务配置和数据库连接等关键步骤。
2025-07-22 11:47:29
363
原创 解决github actions运行时setup python中python版本和指定版本不一样的问题
在GitHub Actions配置YML文件时,为Python版本号添加引号解决了报错问题。最初使用python-version: 3.10会导致系统误识别为3.1版本,而修改为python-version: '3.10'后正常运行。这提示在YML文件中,数字版本号需要用引号包裹以避免小数点被误解析。
2025-07-11 16:28:05
279
原创 [论文翻译]PPA: Preference Profiling Attack Against Federated Learning
PPA论文翻译
2025-05-13 18:36:54
841
原创 ida-pro-mcp安装报错解决:No matching distribution found for mcp>=1.6.0
原来python版本为3.8,下载python3.11后,用命令。AI说是python版本问题,运行命令。
2025-04-28 16:08:57
958
原创 问题解决:vmware设置共享文件夹后找不到/mnt/hgfs
首先需要在/mnt目录下创建文件夹hgfs。这样就能找到/mnt/hgfs文件夹了。
2025-02-17 18:55:50
1127
原创 Error response from daemon: Get “https://registry-1.docker.io/v2/“ 问题解决
问题的根源在于系统每次都会自动修改DNS,所以需要永久修改。编辑文件,内容为需要的dns,如。,可以看到已经有新的DNS。没有该文件的话需要安装。
2024-12-23 23:02:16
5413
原创 云安全实践 环境配置记录
如果只使用 -s 而不加 -S,请求失败后可能不会显示任何错误信息,而 -S 能帮助调试错误。下载 Docker 的 GPG 密钥(用于验证下载软件包的来源),并保存到 /etc/apt/keyrings/docker.asc 文件中。signed-by=/etc/apt/keyrings/docker.asc:指定签名密钥文件的位置,用于验证下载的软件包来源。替代传统的 docker-compose 命令,通过 Docker 的 CLI 集成(如 docker compose 命令)。
2024-11-25 08:49:33
1112
原创 opengait代码运行之gaitedge 未完成版
本次任务为运行opengait代码。主要侧重于gaitedge,需要用到的数据集为CASIA-B。电脑配置:windows带有2个GPU。
2024-05-06 21:49:14
1537
1
原创 torchvision.datasets.ImageFolder
torchvision.datasets.ImageFolder 是 PyTorch 中 torchvision 库提供的一个用于加载图像数据集的类,特别适用于处理按类别组织的图像数据集。通过使用 ImageFolder 类,你可以轻松地加载包含图像数据的文件夹,并且该类会自动根据文件夹结构解析出每个类别的图像数据。
2024-03-26 21:39:06
752
原创 关于《动手学深度学习》找不到d2l.......和#@save的思考
在运行书上的代码时,会出现报错。最后通过简单粗暴的方法解决了这个问题,在此记录一下。
2024-03-20 11:00:03
973
1
原创 《动手学深度学习》第2章 预备知识 部分笔记
《动手学深度学习》第2章部分笔记(数据预处理,自动微分,概率)主要是记录自学过程中不理解的函数,方便复习,再加上一些课后练习
2024-03-13 17:47:50
931
原创 b站小土堆pytorch学习记录—— P25-P26 网络模型的使用和修改、保存和读取
网络模型的使用、修改(add_module,[]=)、保存和读取(save和load)
2024-03-07 23:05:05
698
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅