通过真实的大学考试题目评估Chat-GPT在Swift语言上的编程能力

论文标题:Evaluate Chat-GPT’s programming capability in Swift through real university exam questions 中文标题:通过真实的大学考试题目评估Chat-GPT在Swift语言上的编程能力

作者信息:

  • Zizhuo Zhang, Information and Network Management Office, Chang’an University, Xi’an, China
  • Lian Wen, School of ICT, Griffith University, Brisbane, Australia
  • Yanfei Jiang, Technology Centre, Xian Rail Transit Group Co. Ltd., Xi’an, China
  • Yongli Liu, School of Information Engineering, Chang’an University, Xi’an, China 通讯作者:Yongli Liu, School of Information Engineering, Chang’an University, Xi’an, China. Email: liuyongli@chd.edu.cn

论文出处:Softw: Pract Exper. 2024;54:2129–2143. wileyonlinelibrary.com/journal/spe

摘要: 本研究评估了OpenAI的GPT-3.5和GPT-4模型使用Swift语言的大学考试题目的编程能力。结果显示,两种GPT模型普遍表现优于平均学生分数,但并未始终超越顶尖学生的表现。这一比较突出了GPT模型在哪些领域表现出色,在哪些领域存在不足,提供了对它们当前编程熟练度的细致看法。研究还揭示了GPT-3.5在某些情况下表现优于GPT-4的惊人实例,表明AI模型能力中存在复杂的变化。通过提供GPT在学术环境中编程技能的明确基准,我们的研究为AI编程教育的未来进步提供了宝贵的见解,并强调了继续发展以充分发挥AI在教育环境中潜力的必要性。

1. 引言: 介绍了人工智能(AI)在高等教育中的显著影响,特别是OpenAI开发的GPT系列模型。讨论了GPT在编程能力方面的多项研究,包括数值方法、错误检测、重构和测试用例生成以及识别代码漏洞等。尽管有证据表明GPT可能在回答多项选择代码问题时面临挑战,但在HackerRank上的Python问题测试中表现出了令人鼓舞的问题解决准确性。然而,关于Codex可能生成记忆代码作为解决方案的担忧仍然存在。研究还表明,GPT在不同编程语言中的能力存在差异。

2. 背景: 讨论了AI回答编程问题时面临的挑战,包括问题的歧义性、领域理解、创造性问题解决和解决方案验证。介绍了ChatGPT如何通过各种方式解决编程挑战,包括理解编程语言和概念、代码验证和调试、创造性问题解决以及处理含糊的问题陈述。同时提供了Swift和SwiftUI的概述。

3. 测试方法: 详细介绍了在移动应用开发(MAD)课程中使用的实验框架和测试方法。包括课程介绍和学生背景、考试结构、评分标准和过程。

0bc15326b991451abab6137f37d723c1.png

4. 结果: 本节揭示了研究的核心发现,包括GPT模型在移动应用开发考试的各种问题类别中的表现,并与学生队列的成就进行了详细比较。使用了方差分析(ANOVA)来确定受访者类型(学生、GPT-3.5、GPT-4)和问题类型(简单、中等、具有挑战性)对考试表现的影响。

5. GPT模型的误差分析: 本节记录了GPT-3.5和GPT-4在考试期间犯下的错误,并试图阐明这些错误背后的原因。

6. 讨论: 探讨了GPT-3.5和GPT-4模型在特定情况下表现出色的意外优势,反思了AI在教育中的角色,以及通过误差分析作为增强AI训练的门户。

7. 结论和未来工作: 总结了研究的主要发现,指出GPT模型尽管具有先进能力,但并未始终超越顶尖学生的表现。讨论了研究的局限性,并提出了未来的研究方向,包括扩大编程语言和更复杂问题类型的范围,以及调查GPT-3.5和GPT-4性能变化背后的原因。最后,强调了在教育环境中负责任和有益地整合AI的重要性。

 

### 回答1: CHAT-GPT并不是一个具体的访问地址,它是一个由OpenAI开发的大型语言模型,可以被集成到各种应用程序中。如果您想使用CHAT-GPT,可以在OpenAI网站上注册API账户并获取API密钥,然后使用API密钥调用CHAT-GPT模型来生成文本或回答问题。 ### 回答2: CHAT-GPT是由OpenAI开发的一种基于自然语言处理的人工智能模型。目前,CHAT-GPT可以在chat.openai.com上进行访问。 在CHAT-GPT的访问页面上,用户可以与模型进行交互式的对话。用户可以输入问题、指令或者对话内容,模型会根据输入给出相应的回答或者响应。 在访问CHAT-GPT之前,用户可能需要创建一个OpenAI的账号,并登录。注册账号的过程相对简单,用户只需提供一些基本信息。OpenAI还可能需要对新用户进行验证,以确保模型的使用安全性。 使用CHAT-GPT进行对话时,用户可以通过直接键入文本与模型交互。模型会理解用户的问题或指令,并基于已学到的知识和文本生成相应的回答。CHAT-GPT使用了近2000万个网页的内容进行训练,因此具备了一定的语言理解和生成能力。 有时,CHAT-GPT也可能会给出错误、不准确或者模棱两可的回答。用户可以通过更明确的问题或指令来引导模型给出更好的回答。 总的来说,CHAT-GPT是一个强大的自然语言处理模型,通过访问chat.openai.com,用户可以与CHAT-GPT展开交互式的对话。 ### 回答3: CHAT-GPT的访问地址是OpenAI的网站https://beta.openai.com/。在这个网站上,用户可以免费体验CHAT-GPT的功能。用户可以输入自己想要的对话的开头,然后CHAT-GPT会生成一个连贯的对话回应。通过这个网站,用户可以测试CHAT-GPT在不同场景下的对话能力和生成的质量。用户可以选择不同的游戏主题,例如“装扮角色游戏”“在末日中生存”等等,CHAT-GPT会生成相应场景的对话内容。用户也可以在对话进行中不断进行修改,并看到CHAT-GPT基于新的输入生成的新的回应。目前在实验阶段,用户使用CHAT-GPT有一定的限制,每个用户每周只能访问一定次数,超过次数需要等待。这是为了避免滥用和保护系统的稳定性。CHAT-GPT的访问地址为用户提供了一个便捷的途径来体验和探索该模型的潜力,并为OpenAI收集用户反馈和数据以进一步改进系统的性能和用户体验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

神一样的老师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值