论文分享（二）——NIPS 2018 利用GAN进行源代码修复

最新推荐文章于 2022-08-23 15:06:36 发布

2020拯救世界

最新推荐文章于 2022-08-23 15:06:36 发布

阅读量889

点赞数

分类专栏：论文阅读文章标签：源代码修复文本对抗样本深度学习

本文链接：https://blog.csdn.net/xunbaobao123/article/details/103063107

版权

论文链接：https://arxiv.org/abs/1805.07475v1

一.研究背景

软件程序中的安全漏洞给计算机系统带来了严重的风险。恶意用户利用这些漏洞可以破坏程序，迫使这些程序崩坏，或是暴露敏感用户信息等。每年都有数以千计的漏洞被公开报告给常见漏洞和披露数据（CVE），还有更多漏洞在内部通过专有代码发现并修补。因为这些漏洞通常是程序员工作的一些疏忽所导致的，所以它们的产生是不可避免的。另一方面，由于开源软件和代码重用的普遍存在，这些漏洞带来的破坏传播速度很快。

概括：
1.安全漏洞——>恶意用户利用——>程序崩坏、暴露敏感用户信息
2.人为的疏忽所致，不可避免
3.开源软件和代码重用的情况，传播速度快

以上的这一现象，使得人们对如何自动修复软件漏洞（即，出错的源代码）这一问题进行研究。NMT（神经机器翻译）系统在文本的翻译和校正上的表现一直相对突出，但训练NMT系统的最常用方法是使用标记的示例对（pair examples）来比较网络输出与期望版本的相似性，这就需要在输入和期望输出数据之间进行一对一映射。在大多数情况下这需要花费大量的时间和精力去人工标记。