- 博客(39)
- 资源 (1)
- 收藏
- 关注
原创 【代码大模型-后门攻击】Poison Attack and Defense on Deep Source Code Processing Models
本文提出了一种针对深度源码处理模型的后门攻击与防御框架。在攻击方面,CodePoisoner通过四种策略(三种基于规则+一种语言模型引导)生成隐蔽的中毒样本,可影响缺陷检测、克隆检测和代码修复等任务。在防御方面,CodeDetector利用集成梯度算法检测异常触发词,有效识别中毒样本。实验表明,该攻击方法在保持代码可编译性的同时实现高攻击成功率(最高达98.9%),防御方法在精确度和召回率上均优于基线。研究揭示了源码处理模型的安全隐患,并提供了实用防御方案。
2025-10-10 10:36:36
899
原创 【代码大模型-后门安全】Backdoors in Neural Models of Source Code
摘要: 本文研究代码大模型中的后门安全,探讨后门攻击与防御方法。攻击方面,提出基于死代码(不改变程序行为)的固定/语法触发器,通过修改输入代码实现静态或动态目标。防御方面,采用改进的光谱特征检测(基于AST路径编码和top-k奇异向量)识别并移除中毒数据。实验在代码摘要任务(Java/Python数据集)验证攻击有效性,动态后门在Python数据上表现较差;防御结果显示光谱方法对seq2seq模型效果显著,但对code2seq模型有限。研究揭示了代码模型后门风险及防御挑战。 关键词: 后门攻击、死代码、光谱
2025-10-09 20:42:36
1090
原创 【代码大模型-后门攻击】You See What I Want You to See: Poisoning Vulnerabilities in Neural Code Search
通过触发攻击target(如果对每个文件都进行攻击则是非目标攻击),trigger更改排名(因此触发器不能改变代码原有的语义),bait使代码易受攻击(应设计能够恶意误导开发者且不易被发现的诱饵)。结果跑表明,BiRNN和Transformer取得了很好的结果,然而在大规模代码语料库上进行预训练的 CodeBERT 对于攻击者引入的小扰动具有更强的鲁棒性。触发器的影响:固定触发器和PCFG触发器的效果类似。(1)计算输入查询和代码库中的代码片段的嵌入向量,其中所有的源代码中的嵌入都可以离线计算并存储;
2025-01-08 20:49:12
830
原创 【通用大模型安全】Setting the Trap: Capturing and Defeating Backdoors in PLM through Honeypots
warm up:首先蜜罐分类器运行一些steps去捕获后门触发器,此时蜜罐分类器中的中毒样本损失值与干净样本的损失值产生了差异,而任务分类器中的两种样本损失值都很高。2.在stem net 的浅层网络组中添加了蜜罐,在训练完成后删除蜜罐,确保对后门的防御。将蜜罐设计成一个在PLM的底层的比较紧凑的分类器。(3)抗后门微调:防御者的目标是开发一种安全的调整程序,以确保在中毒数据集上训练的 PLM 不会学习后门功能。q无限趋向于0时,变为标准的CE,而随着q的增加蜜罐学习后门样本的速度更快,但过大的1。
2024-12-24 18:09:23
587
原创 【大模型安全】NEURAL ATTENTION DISTILLATION: ERASING BACKDOOR TRIGGERS FROM DEEP NEURAL NETWORKS论文阅读
EURAL ATTENTION DISTILLATION: ERASING BACKDOOR TRIGGERS FROM DEEP NEURAL NETWORKS论文阅读
2024-11-21 16:35:18
1314
1
原创 【代码大模型的隐私安全】Unveiling Memorization in Code Models论文阅读
Unveiling Memorization in Code Models论文阅读
2024-11-19 19:27:43
1395
1
原创 【代码大模型】Compressing Pre-trained Models of Code into 3 MB论文阅读
Compressing Pre-trained Models of Code into 3 MB论文阅读笔记
2024-11-16 21:22:28
1358
1
原创 【代码大模型】Is Your Code Generated by ChatGPT Really Correct?论文阅读
Is Your Code Generated by ChatGPT Really Correct? Rigorous Evaluation of Large Language Models for Code Generation 论文阅读笔记
2024-11-15 11:20:48
1226
3
原创 Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey阅读笔记
论文阅读笔记
2024-10-17 19:24:53
1229
原创 【git命令相关】git上传和删除文件步骤
1. git bash窗口输入2. 生成密钥在此命令执行的返回结果中找到key存放的位置,打开id_rsa.pub(用记事本打开较好),复制粘贴到github的设置界面的ssh配置当中。
2024-08-20 15:24:59
359
原创 mpi教程
mpi是一个跨语言的通讯协议,用于编写并行计算机。根据mpi教程学习并总结出的mpi学习随记。包括mpich的安装、在linux中运行的方法与mpi各种功能函数的实现。
2023-01-03 11:07:05
741
原创 嵌入式系统原理及应用《基于ARM Cortex-M3 内核的STM32F103系列微控制器》思维导图
嵌入式思维导图,基于ARM Cortex-M3内核的STM32F103的微控制器
2022-05-11 19:02:58
5407
1
原创 计算机组成原理思维导图
计算机组成原理思维导图,每张思维导图的标题(例如:组原1、组原2·····)是我们上课学习的顺序,章节顺序是按照《计算机组成原理》的章节顺序。大家可以根据自己的学习情况,选择更适合自己的方法。第一章 计算机系统概论第三章 系统总线第四章 存储器第六章 计算机的运算方法## 第七章 指令系统...
2022-05-11 18:44:13
7499
原创 小程序通过HTTP协议获取onenet平台上的图片数据并展示
小白学程序,今天跟我学!hhhhh做了一个物联网项目,想用微信小程序将获取onenet上的图片数据并且展示在小程序端。首先,http协议api的使用方法和mqtt基本一样,具体看开发文档:onenet api开发文档但是,如果想获取图片数据, “http://api.heclouds.com/devices/device_id/datapoints”...
2022-03-15 23:34:34
3643
6
原创 二.python基本图形绘制
python基本图形绘制2.1pyhton蟒蛇绘制2.2turtle库的使用2.3turtle程序语法元素分析2.1pyhton蟒蛇绘制#PythonDraw.pyimport turtleturtle.setup(650,350,200,200)turtle.penup()turtle.fd(-250)turtle.pendown()turtle.pensize(25)turtle.pencolor("purple")turtle.seth(-40)for i in range(4)
2021-02-01 21:20:24
190
原创 一.python基本语法元素
这里写自定义目录标题1.1程序设计基本方法和环境配置1.3温度交换实例功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入1.1程序设计基本方法和环境配置编程方法:编译与解释根据 执行方式 不同分类:静态语言[C,C++,Jav
2021-02-01 17:49:48
130
RSA加密算法c++实现
2022-04-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅