AI也造代码屎山!研究发现GitHub Copilot代码可维护性差,偏爱“无脑重写”而非重构复用已有代码...

文章来源 量子位 

AI帮忙写代码程序员用了都说好,但代码质量真的靠谱吗?

结果或许令你大跌眼镜。

一家名为GitClear的公司分析了近四年超过1.5亿行代码后发现,随着GitHub Copilot工具的加入,代码流失率(即代码写入后不久又被返工修改、删除的情况)出现了显著上升:

2023年为7.1%,而2020年时仅为3.3%,翻了一番。

6725f21d9bc2615350ed176ea8c95113.png

与之相应的,代码复用率也出现了明显下降。

言外之意,AI写的很多内容其实不亚于“屎山”,根本不好随着业务的变化作相应更改。

看起来,AI编程工具还远没有宣传中的那么好用?

Copilot更爱直接添加代码而不鼓励复用

GitClear收集的1.5亿行代码中,有3/2来自匿名私企,剩下的1/3则源自于谷歌、Meta和微软的开源项目。

它们全部被排除了“噪声”数据,比如在多个分支中提交的一模一样的代码、空行以及其他没有意义的代码行。

调查的主要对象是微软的GitHub Copilot。

它于2021年6月推出测试版,按照CEO说法,截至2023年第三季度,该工具已有超100万开发者付费订阅,能够帮助开发者编写46%的代码,并将编码速度提高55%。

96b63d3c39297372ab6691884a64aa82.png

不过在此,GitClear不关心编码速度,只关心质量。

“AI编程工具更类似于高级开发人员,仔细又精细?还是更像短期承包商一样,只在乎面前的任务完成与否?”

为此,他们统计了这1亿行+代码的新增、删除、更新、移动、复制/粘贴等情况,得出了这样一个趋势表格:

e132d1570f155c48e6169946127bd5d0.png

从中我们可以发现:

Copilot添加代码、复制/粘贴代码的百分比比更新、删除和移动增加得更明显。

其中我们还可以清晰地看到,移动代码的百分比从2020年的25%下降到了13.4%,这是所有数据中唯一一个反向特例。

更少的移动意味着更少的重构和复用,加上大幅增长的添加、复制/粘贴代码,这表明:

AI编程工具并不鼓励代码复用、在已有代码上进行修改,而是更倾向于“无脑重写”。

在此,GitClear也指出,过度新增代码、复制/粘贴对代码的长期可维护性也相当不利。

这其实在人类程序员中也是老问题,可能是程序员觉得解决当下问题比思考如何复用、整合现有代码更快更容易,也可能是因为同个项目组中的开发人员沟通不畅等。

遭殃的就变成后面的维护人员。

3a44ee0f94147ade347b868ca4bfb3f9.png

Copilot的代码质量下降也体现在代码流失率(Churn)这个数据上。

在此,它的标准定义是代码编写后不到两周的时间内修改更新的百分比。

表格显示,2020年的流失率为3.3%(那会还没有用上Copilot),2023年增长到5.5%。

GitClear预计,2024年将直接相比2020年翻一番之多,达到7.1%。

这说明AI的加速,并没有带来足够高质量的代码。

除了以上结论,GitClear还发现,Copilot的代码建议算法还被设计为总是提出最有可能被用户接受的建议——

这选择乍一听没啥毛病,但其实会忽略代码简洁易读的重要性。

总的来说,这项结果足以让那些担心AI编程工具会取代人类程序员的人暂时把心放肚子里。

最近也有不少其他研究佐证了GitClear的发现。

比如来自CodeScene的一篇报告就表示:

在编码任务中,AI远无法取代人类;今天的AI太容易出错,且远未达到能够安全修改已有代码的程度。

d550b117150ad38631f9ec7d36e0ef2a.png

网友体验大差不差

实实在在使用过Copilot的人怎么说?

一位网友表示:

我用了俩个月后取消了会员,因为花了太多精力去检查AI给出的代码以及修复bug。

在TA看来,现阶段还是自己编写内容要省力得多,因为自己知道自己想要写什么,修复自己的bug总是比修复机器人的更容易。

619ff19ddf961e48a47b6ad84f50e3b4.png

有人使用的是ChatGPT而非Copilot,也对TA的话表示了赞同:

我对AI的能力感到惊讶,但还是不会称其为“好代码”。

3ab72a733c7a794872b3a7ab0ffbd324.png

当然,Copilot在大家眼里也并非一无是处。

一位从事web开发20多年的程序员就表示:

用它编写重要的SQL或TypeScript代码时,总是失败;但对于编写测试、请求处理、React样式等等来说,它还是可以帮我节省大量时间的。

b4a181074b3c9a30be5fc97c83e4ec50.png

你的Copilot(或者其他AI编码工具)体验如何?你同意GitClear的发现吗?

参考链接:
[1]https://devclass.com/2024/01/24/ai-assistance-is-leading-to-lower-code-quality-claim-researchers/
[2]https://visualstudiomagazine.com/articles/2024/01/25/copilot-research.aspx
[3]https://www.gitclear.com/coding_on_copilot_data_shows_ais_downward_pressure_on_code_quality

关注公众号【机器学习与AI生成创作】,更多精彩等你来读

不是一杯奶茶喝不起,而是我T M直接用来跟进 AIGC+CV视觉 前沿技术,它不香?!

卧剿,6万字!30个方向130篇!CVPR 2023 最全 AIGC 论文!一口气读完

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

深入浅出ControlNet,一种可控生成的AIGC绘画生成算法! 

经典GAN不得不读:StyleGAN

838ecaed31b1551542e86b8042c2b990.png 戳我,查看GAN的系列专辑~!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

点击跟进 AIGC+CV视觉 前沿技术,真香!,加入 AI生成创作与计算机视觉 知识星球!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值