论文翻译：Can LLM Replace Stack Overflow? A Study on Robustness and Reliability of Large Language

CSPhD-winston-杨帆

已于 2024-07-20 09:06:47 修改

阅读量620

点赞数 18

分类专栏：论文翻译 LLMs-鲁棒性文章标签：人工智能

于 2024-07-18 21:58:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/whiffeyf/article/details/140534265

版权

论文翻译同时被 2 个专栏收录

92 篇文章 3 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

19 篇文章 1 订阅

订阅专栏

Can LLM Replace Stack Overflow? A Study on Robustness and Reliability of Large Language Model Code Generation

大型语言模型能否取代 Stack Overflow？关于大型语言模型代码生成的鲁棒性和可靠性研究

作者： 李忠，王子龙

摘要：

最近，大型语言模型（LLMs）显示出了非凡的能力，能够理解自然语言并生成编程代码。当遇到编码问题时，软件工程师咨询 LLMs 已成为一种常见做法。尽管已经做出了努力以避免语法错误并使代码与预期语义一致，但 LLMs 代码生成的可靠性和鲁棒性尚未得到充分研究。可执行代码并不等同于可靠和鲁棒的代码，尤其是在现实世界软件开发的背景下。例如，生成代码中对 API 的误用可能导致严重问题，如资源泄漏、程序崩溃等。现有的代码评估基准和数据集侧重于构建诸如编程面试中的编程问题等小型任务。然而，这偏离了开发人员通常咨询 LLMs 的问题。为了填补这一缺失的部分，我们提出了一个数据集 RobustAPI，用于评估由 LLMs 生成的代码的可靠性和鲁棒性。我们从 Stac

了解本专栏

超级会员免费看

CSPhD-winston-杨帆

关注

18
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。