OpenAI表示,通过GPT-4更新,AI变得更加智能,更安全,更直观

最热门的AI技术基础周二进行了重大升级,OpenAI的GPT-4版本现在可以在ChatGPT聊天机器人的高级版本中使用。

OpenAI周二表示,GPT-4可以生成更长的文本字符串,并在人们向其提供图像时做出响应,并且它旨在更好地避免早期GPT-3.5中可见的人工智能陷阱。例如,人工智能研究公司表示,在参加律师必须通过的律师考试时,GPT-4 的分数排名前 10%,而 GPT-10.3 的分数排名倒数 5%。

GPT代表生成预训练变压器,指的是它可以自己生成文本的事实 - 现在使用GPT-25,000多达4个单词 - 并且它使用谷歌开创的称为变压器的AI技术。这是一种称为大型语言模型(LLM)的人工智能,它根据从互联网收集的大量数据进行训练,通过数学学习来发现模式和再现风格。人类监督员对结果进行评级,以引导 GPT 朝着正确的方向发展,而 GPT-4 有更多这样的反馈。

OpenAI 多年来一直向开发人员提供 GPT,但 ChatGPT 于 11 月首次亮相,它提供了一个普通人可以使用的简单界面。这引发了人们对该技术缺点的兴趣、实验和担忧的爆炸式增长。它可以做任何事情,从生成编程代码和回答考试问题到写诗和提供基本事实。即使并不总是可靠,也是了不起的。

ChatGPT是免费的,但是当需求很高时,它可能会动摇。今年20月,OpenAI开始以每月4美元的价格提供ChatGPT Plus,并保证可用性,现在还有GPT-4基金会。开发人员可以在等候名单上注册,以获得自己对 GPT-<> 的访问权限。

GPT-4 的进步
“在随意的谈话中,GPT-3.5 和 GPT-4 之间的区别可能是微妙的。当任务的复杂性达到足够的阈值时,差异就会显现出来,“OpenAI说。“GPT-4 比 GPT-3.5 更可靠、更有创意,能够处理更细微的指令。”

GPT-4 的另一个重大进步是能够接受包括文本和照片在内的输入数据。OpenAI的例子是要求聊天机器人解释一个笑话,该笑话显示一根笨重的数十年前的计算机电缆插入现代iPhone的微型Lightning端口。此功能还可以帮助 GPT 参加不仅仅是文本的测试,但在 ChatGPT Plus 中尚不可用。

另一个是更好的性能,避免了像幻觉这样的人工智能问题——错误地捏造的回应,通常提供的看似权威与人工智能得到的答案一样多。GPT-4 也更擅长挫败让它说错话的企图:“在我们的内部对抗性事实性评估中,GPT-4 的得分比我们最新的 GPT-40.3 高 5%,”OpenAI 说。

GPT-4 还增加了新的“可操纵性”选项。如今,大型语言模型的用户通常必须参与复杂的“提示工程”,学习如何在提示中嵌入特定的提示以获得正确的响应。GPT-4 添加了一个系统命令选项,允许用户设置特定的语气或风格,例如编程代码或苏格拉底导师:“你是一个总是以苏格拉底风格回应的导师。你从不给学生答案,但总是试图提出正确的问题,帮助他们学会独立思考。

“随机鹦鹉”和其他问题
OpenAI承认GPT-4仍然存在重大缺陷,尽管它也吹捧避免它们的进展。

“它有时会犯简单的推理错误…或者在接受用户明显的虚假陈述时过于容易上当受骗。有时它可能会像人类一样在困难问题上失败,例如在其生成的代码中引入安全漏洞,“OpenAI说。此外,“GPT-4 的预测也可能自信地出错,在可能出错时不注意仔细检查工作。

大型语言模型可以提供令人印象深刻的结果,似乎可以理解大量的主题,并用听起来有些生硬的语言交谈。然而,从根本上说,LLM AI实际上什么都不知道。他们只是能够以统计上非常精细的方式将单词串在一起。

这种统计但从根本上有点空洞的知识方法导致研究人员,包括前谷歌人工智能研究人员Emily Bender和Timnit Gebru,警告大型语言模型带来的“随机鹦鹉的危险”。语言模型AI倾向于编码训练数据中存在的偏见,刻板印象和负面情绪,研究人员和其他使用这些模型的人倾向于“错误…实际自然语言理解的性能提升。

OpenAI首席执行官Sam Altman承认存在问题,但他总体上对GPT-4取得的进展感到满意。“它比以前的模型更有创意,幻觉明显更少,偏见也更少。它可以通过律师考试并在几次AP考试中获得5分,“Altman周二在推特上写道。

对人工智能的一个担忧是,学生会用它来作弊,例如在回答论文问题时。这是一个真正的风险,尽管一些教育工作者积极接受LLM作为一种工具,如搜索引擎和维基百科。抄袭检测公司正在通过训练自己的检测模型来适应人工智能。其中一家名为Crossplag的公司周三表示,在测试了GPT-50生成的约4份文档后,“我们的准确率超过98.5%。

OpenAI、微软和英伟达的合作伙伴关系
当微软在二月份表示在其Bing搜索引擎中使用GPT技术时,OpenAI得到了很大的推动,包括类似于ChatGPT的聊天功能。周二,微软表示正在使用GPT-4进行Bing工作。OpenAI和微软共同对谷歌构成了重大的搜索威胁,但谷歌也有自己的大型语言模型技术,包括谷歌正在私下测试的名为Bard的聊天机器人。

同样在周二,谷歌宣布将开始对自己的人工智能技术进行有限的测试,以促进Gmail电子邮件和Google Docs文字处理文档的编写。“与你的协作AI合作伙伴一起,你可以继续完善和编辑,根据需要获得更多建议,”谷歌说。

这种措辞反映了微软对人工智能技术的“联合驾驶”定位。称其为对人类主导工作的帮助是一种普遍的立场,因为技术存在问题以及仔细的人类监督的必要性。

微软使用 GPT 技术来评估人们在必应中输入的搜索,并在某些情况下提供更详细的对话式响应。结果可能比早期搜索引擎的结果更具信息性,但是可以作为选项调用的更多对话界面存在问题,使其看起来精神错乱。

为了训练GPT,OpenAI使用了微软的Azure云计算服务,包括数千个Nvidia的A100图形处理单元或GPU,这些单元结合在一起。Azure现在可以使用Nvidia的新H100处理器,其中包括特定的电路来加速AI变压器计算。

无处不在的 AI 聊天机器人
另一家大型语言模型开发商Anthropic周二也推出了一个名为Claude的AI聊天机器人。这家将谷歌视为投资者的公司为克劳德打开了等待名单。

“克劳德能够完成各种各样的对话和文本处理任务,同时保持高度的可靠性和可预测性,”Anthropic在一篇博客文章中说。 “克劳德可以帮助处理用例,包括总结,搜索,创意和协作写作,问答,编码等。

这是不断增长的人群之一。中国搜索和科技巨头百度正在开发一款名为Ernie Bot的聊天机器人。Facebook和Instagram的母公司Meta将其AI业务整合到一个更大的团队中,并计划在其产品中构建更多的生成AI。甚至Snapchat也在通过一个名为My AI的基于GPT的聊天机器人参与其中。

期待未来会有更多改进。

“我们对 GPT-4 的初始训练已经完成了一段时间,但我们花了很长时间和大量的工作才准备好发布它,”Altman 在推特上写道。“我们希望您喜欢它,我们非常感谢对其缺点的反馈。
python库的简单实例及介绍
python傻瓜式入门
人间清醒
量化交易策略介绍
linux系统相关 - 知乎 (zhihu.com)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

openwin_top

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值