论文阅读：Exploring the Robustness of Large Language Models for Solving Programming Problems

最新推荐文章于 2024-11-12 19:08:30 发布

CSPhD-winston-杨帆

最新推荐文章于 2024-11-12 19:08:30 发布

阅读量606

点赞数 6

分类专栏： LLMs-鲁棒性文章标签：论文阅读语言模型人工智能

本文链接：https://blog.csdn.net/WhiffeYF/article/details/140280520

版权

LLMs-鲁棒性专栏收录该内容

19 篇文章 1 订阅

订阅专栏

Exploring the Robustness of Large Language Models for Solving Programming Problems

《Exploring the Robustness of Large Language Models for Solving Programming Problems》，作者是Atsushi Shirafuji、Yutaka Watanobe、Takumi Ito、Makoto Morishita、Yuki Nakamura、Yusuke Oda和Jun Suzuki，分别来自会津大学、东北大学和日本电信通信科学实验室。

摘要

论文探讨了大型语言模型（LLMs）在解决编程问题方面的鲁棒性。近期，基于Transformer的模型，如Codex和ChatGPT，显示出解决编程问题的高度能力。然而，这些模型是基于对问题描述的理解生成程序，还是仅仅基于训练数据中的相关问题检索源代码，这一点尚未明确。为了探索这个问题，作者对几种流行的LLMs进行了实验，包括CodeGen和GPT-3.5系列模型，这些模型能够处理编程入门问题中的代码生成任务。实验结果表明，CodeGen和Codex对问题描述的表面修改非常敏感，这显著影响了代码生成性能。此外，Codex依赖于变量名，随机化变量名显著降低了解决率。然而，最新技术（SOTA）模型，如InstructGPT和ChatGPT，显示出对表面修改的更高鲁棒性，并具有解决编程问题的卓越能力。