润泽今天好好学习了吗-CSDN博客

原创【代码大模型-后门攻击】Poison Attack and Defense on Deep Source Code Processing Models

本文提出了一种针对深度源码处理模型的后门攻击与防御框架。在攻击方面，CodePoisoner通过四种策略（三种基于规则+一种语言模型引导）生成隐蔽的中毒样本，可影响缺陷检测、克隆检测和代码修复等任务。在防御方面，CodeDetector利用集成梯度算法检测异常触发词，有效识别中毒样本。实验表明，该攻击方法在保持代码可编译性的同时实现高攻击成功率（最高达98.9%），防御方法在精确度和召回率上均优于基线。研究揭示了源码处理模型的安全隐患，并提供了实用防御方案。

2025-10-10 10:36:36 920

原创【代码大模型-后门安全】Backdoors in Neural Models of Source Code

摘要：本文研究代码大模型中的后门安全，探讨后门攻击与防御方法。攻击方面，提出基于死代码（不改变程序行为）的固定/语法触发器，通过修改输入代码实现静态或动态目标。防御方面，采用改进的光谱特征检测（基于AST路径编码和top-k奇异向量）识别并移除中毒数据。实验在代码摘要任务（Java/Python数据集）验证攻击有效性，动态后门在Python数据上表现较差；防御结果显示光谱方法对seq2seq模型效果显著，但对code2seq模型有限。研究揭示了代码模型后门风险及防御挑战。关键词：后门攻击、死代码、光谱

2025-10-09 20:42:36 1110

原创【代码大模型-后门攻击】You See What I Want You to See: Poisoning Vulnerabilities in Neural Code Search

通过触发攻击target（如果对每个文件都进行攻击则是非目标攻击），trigger更改排名（因此触发器不能改变代码原有的语义），bait使代码易受攻击（应设计能够恶意误导开发者且不易被发现的诱饵）。结果跑表明，BiRNN和Transformer取得了很好的结果，然而在大规模代码语料库上进行预训练的 CodeBERT 对于攻击者引入的小扰动具有更强的鲁棒性。触发器的影响：固定触发器和PCFG触发器的效果类似。（1）计算输入查询和代码库中的代码片段的嵌入向量，其中所有的源代码中的嵌入都可以离线计算并存储；

2025-01-08 20:49:12 850

原创【通用大模型安全】Setting the Trap: Capturing and Defeating Backdoors in PLM through Honeypots

warm up：首先蜜罐分类器运行一些steps去捕获后门触发器，此时蜜罐分类器中的中毒样本损失值与干净样本的损失值产生了差异，而任务分类器中的两种样本损失值都很高。2.在stem net 的浅层网络组中添加了蜜罐，在训练完成后删除蜜罐，确保对后门的防御。将蜜罐设计成一个在PLM的底层的比较紧凑的分类器。（3）抗后门微调：防御者的目标是开发一种安全的调整程序，以确保在中毒数据集上训练的 PLM 不会学习后门功能。q无限趋向于0时，变为标准的CE，而随着q的增加蜜罐学习后门样本的速度更快，但过大的1。

2024-12-24 18:09:23 594

RSA加密算法c++实现

空空如也