云霄星乖乖的果冻-CSDN博客

原创 02预备知识——李沐《动手学深度学习》个人笔记

李沐《动手学深度学习》第二章预备知识个人笔记

2025-12-11 00:42:37 797

原创 01引言——李沐《动手学深度学习》个人笔记

李沐《动手学深度学习》01引言笔记

2025-12-09 15:28:57 686

原创【文献阅读】TrustRAG: Enhancing Robustness and Trustworthiness in Retrieval-Augmented Generation

本文提出TrustRAG框架，针对检索增强生成(RAG)系统面临的语料库投毒攻击问题，提出双阶段防御方案。TrustRAG首先通过聚类分析检测嵌入空间中聚集的恶意文档，结合ROUGE分数进行初步过滤；随后利用大语言模型(LLM)自身知识进行内容一致性校验，智能选择可靠知识源生成最终回答。实验表明，该框架可降低攻击成功率最高达80%，同时提升回答准确率30%，显著优于现有防御方案。TrustRAG作为首个能同时防御单点和多点语料注入攻击的框架，具备即插即用特性，可无缝集成各类开源/闭源语言模型。

2025-12-08 22:06:43 1037

原创【文献阅读】TrafficLLM: Enhancing Large Language Models for Network Traffic Analysis with Generic Traffic

【原文翻译】基于机器学习（ML）的网络流量分析已被广泛用于威胁检测。然而，此类方法在不同任务和未见数据上的泛化能力非常有限。大语言模型（LLMs）以其强大的泛化能力著称，并在多个领域展现出优异的性能。但由于网络流量具有显著不同的特性，其在流量分析领域的应用受到限制。为解决这一问题，本文提出TrafficLLM，它引入了一个双阶段微调框架，旨在从异构的原始流量数据中学习通用的流量表示。该框架采用流量领域分词双阶段调优流程和可扩展适配。

2025-12-05 22:40:59 840

原创【文献阅读】Spa-VLM: Stealthy Poisoning Attacks on RAG-based VLM

本文提出首个针对基于RAG视觉语言模型(VLM)的多模态投毒攻击方法Spa-VLM。研究发现，现有单模态RAG投毒攻击在多模态场景下完全失效(失败率100%)。Spa-VLM通过同步构造对抗性图像和误导性文本的恶意条目，在10万和200万规模知识库中仅注入5个恶意条目即可实现超过0.8的攻击成功率，显著优于现有方法。实验表明，当前防御机制均无法有效抵御该攻击，凸显了多模态RAG系统的安全脆弱性。研究揭示了VLM在政治、医疗等关键领域部署时的潜在风险。

2025-11-25 14:59:47 1009

原创【文献阅读】【RAG攻击综述】Surveying the RAG Attack Surface and Defenses: Protecting Sensitive Company Data

摘要：本文系统研究了检索增强生成（RAG）技术的安全漏洞及其防御措施。随着大语言模型（LLM）在企业应用的普及，RAG因无需微调即可定制模型知识而备受青睐，但其引入的安全风险尚未被充分认知。研究通过文献综述归纳出12类攻击手段（如语料库污染、提示词注入、越狱攻击等），并分析其攻击点（数据语料库、检索器、LLM）。同时梳理了27种前沿防御措施（如知识扩展、提示过滤等），为企业部署RAG提供安全指南。研究填补了RAG攻击面系统化认知的空白，为组织平衡效率提升与数据安全提供决策依据。

2025-11-24 20:02:48 622

原创【文献阅读】PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in ...

本文提出协同提示-RAG攻击（PR-Attack），通过联合优化知识库投毒文本和提示后门触发器，有效提升基于检索增强生成的大语言模型攻击效果。针对现有方法在投毒文本数量受限时攻击成功率下降、隐蔽性不足等问题，PR-Attack将攻击建模为双层优化问题：上层优化触发器使模型在激活/非激活时分别输出目标/正确答案；下层优化投毒文本以确保其被检索。实验表明，该方法在仅注入少量投毒文本时仍保持高攻击成功率，且不易被检测。这一工作揭示了多组件协同攻击的潜在风险，为提升RAG系统安全性提供了重要启示。

2025-11-16 21:12:30 616

原创【文献阅读】PoisonedRAG: Knowledge Corruption Attacks to Retrieval-Augmented Generation of Large Language

本文提出PoisonedRAG攻击方法，首次揭示了检索增强生成（RAG）系统中知识数据库的安全漏洞。攻击者通过向知识库注入少量恶意文本（每个目标问题5个），就能诱导LLM对特定问题生成攻击者预设的答案（如错误CEO信息或商业偏见），在黑盒设置下攻击成功率高达97%。研究将攻击建模为优化问题，提出分解恶意文本为两个子部分分别满足检索条件和生成条件的创新方法，并通过实验证明现有防御措施无效，凸显了开发新型防御机制的必要性。这项工作填补了RAG系统安全性研究的空白，为AI安全领域提供了重要警示。

2025-11-16 14:23:13 865

原创 C++中.push_back()和.emplace_back()的比较

和都是 C++ STL 中向容器（如）尾部添加元素的方法，但它们在实现方式和性能上有显著差异。C++ 完美转发深度解析:从入门到精通C++:深入理解移动语义。

2025-09-09 11:36:09 865

原创 anaconda下载与pycharm解析器配置

用pycharm新建一个项目，或打开已有的项目。Type选择Conda。由于我之前没有创建环境，因此，这里选择“Generate new”，即创建一个新环境。点击ok后，便自动创建一个新环境，并切换到该环境。其中，安装包可以直接到官网下载。这样解析器就配置好啦。

2025-09-03 00:01:29 296

原创靶场搭建记录

本文介绍了phpStudy的下载安装与配置过程，以及Pikachu靶场环境搭建方法。主要内容包括：1）从xp.cn下载phpStudy v8.1版本并完成安装；2）启动Apache和MySQL服务，配置MySQL环境变量；3）从GitHub下载Pikachu靶场文件，部署到phpStudy的WWW目录；4）修改数据库配置文件并初始化安装。通过127.0.0.1访问确认配置成功，为后续Web安全测试提供了本地实验环境。整个过程详细说明了软件安装、服务配置和数据库连接等关键步骤。

2025-07-22 11:47:29 363

原创解决github actions运行时setup python中python版本和指定版本不一样的问题

在GitHub Actions配置YML文件时，为Python版本号添加引号解决了报错问题。最初使用python-version: 3.10会导致系统误识别为3.1版本，而修改为python-version: '3.10'后正常运行。这提示在YML文件中，数字版本号需要用引号包裹以避免小数点被误解析。

2025-07-11 16:28:05 279

原创 JS模块导出导入笔记 —— 默认导出 & 具名导出

JS默认导出与具名导出

2025-07-03 20:56:37 360

原创 [论文翻译]PPA: Preference Profiling Attack Against Federated Learning

PPA论文翻译

2025-05-13 18:36:54 841

原创 ida-pro-mcp安装报错解决：No matching distribution found for mcp＞=1.6.0

原来python版本为3.8，下载python3.11后，用命令。AI说是python版本问题，运行命令。

2025-04-28 16:08:57 958

原创问题解决：vmware设置共享文件夹后找不到/mnt/hgfs

首先需要在/mnt目录下创建文件夹hgfs。这样就能找到/mnt/hgfs文件夹了。

2025-02-17 18:55:50 1127

原创 Error response from daemon: Get “https://registry-1.docker.io/v2/“ 问题解决

问题的根源在于系统每次都会自动修改DNS，所以需要永久修改。编辑文件，内容为需要的dns，如。，可以看到已经有新的DNS。没有该文件的话需要安装。

2024-12-23 23:02:16 5413

原创云安全实践环境配置记录

如果只使用 -s 而不加 -S，请求失败后可能不会显示任何错误信息，而 -S 能帮助调试错误。下载 Docker 的 GPG 密钥（用于验证下载软件包的来源），并保存到 /etc/apt/keyrings/docker.asc 文件中。signed-by=/etc/apt/keyrings/docker.asc：指定签名密钥文件的位置，用于验证下载的软件包来源。替代传统的 docker-compose 命令，通过 Docker 的 CLI 集成（如 docker compose 命令）。

2024-11-25 08:49:33 1112

原创基于菜鸟教程的flask学习记录 —— Flask视图函数

flask视图函数，基于菜鸟教程

2024-09-16 21:23:03 1473 2

原创 matlab中plot的一些用法

matlab中plot的一些用法

2024-07-19 17:32:09 3313

原创 logging基本用法

logging的简单用法

2024-07-18 21:15:39 1132 1

原创 argparse部分用法

argparse的部分用法

2024-07-18 17:31:22 1059

原创关于在远程服务器上运行分布式代码，端口被占用的问题

端口占用——找到可用端口，重新设置

2024-05-20 13:31:21 503 3

原创 pycharm用ssh连接远程服务器

pycharm用ssh连接远程服务器，上传文件。写得比较简略，仅供参考，不理解的可以私信或者评论区讨论

2024-05-18 11:18:32 1971

原创 opengait代码运行之gaitedge 未完成版

本次任务为运行opengait代码。主要侧重于gaitedge，需要用到的数据集为CASIA-B。电脑配置：windows带有2个GPU。

2024-05-06 21:49:14 1537 1

原创读（用知云翻译）gaitedge论文

对gaitedge论文的翻译

2024-04-29 16:09:44 1158

原创 Anaconda和pytorch的安装

Anaconda和pytorch的安装，以及简要介绍了如何在pycharm中配置解释器

2024-04-23 23:55:05 2672

原创关于conda占C盘内存的问题

conda占太多C盘内存了，清掉，统统清掉！

2024-04-22 17:00:09 4450 1

原创 opengait中common代码+注释

opengait中utils下common.py代码注释

2024-04-22 15:26:26 419

原创数位统计DP——计数问题（acwing338）

数位统计DP。给定两个整数 a 和 b，求 a 和 b 之间的所有数字中 0∼9 的出现次数。

2024-04-02 23:28:49 846

原创 torchvision.datasets.ImageFolder

torchvision.datasets.ImageFolder 是 PyTorch 中 torchvision 库提供的一个用于加载图像数据集的类，特别适用于处理按类别组织的图像数据集。通过使用 ImageFolder 类，你可以轻松地加载包含图像数据的文件夹，并且该类会自动根据文件夹结构解析出每个类别的图像数据。

2024-03-26 21:39:06 752