GPT-4并不是chatGPT的升级。
尽管 ChatGPT 最初被描述为 GPT-3.5(因此比 GPT-3 更进一步),但它本身并不是 OpenAI 大型语言模型的版本,而是一个基于其动力的基于聊天的接口。在过去几个月里爆炸性增长的 ChatGPT 是与 GPT-3.5 交互的一种方式,将来也会是与 GPT-4 交互的一种方式。
让我们来看看你所熟知和喜爱的聊天机器人与其新近增强的后继者之间的差异
多模态
GPT-4 能够看到和理解图像!这个多功能的机器学习系统最明显的变化是它是“多模式”的,这意味着它可以理解多种信息“模式”。ChatGPT 和 GPT-3 只限于文本:它们可以阅读和写作,但仅此而已(尽管对于许多应用程序来说已经足够)。
然而,GPT-4 可以处理图像以查找相关信息。当然,你可以简单地要求它描述图片中的内容,但更重要的是,它的理解超越了这个范围。OpenAI 提供的例子实际上让它解释了一个笑话中荒谬的超大型 iPhone 连接器的形象,但与 Be My Eyes 的合作更加显眼,这是一款供盲人和视力低下的人使用的应用程序,让志愿者描述他们的手机看到的内容。
在 Be My Eyes 的视频中,GPT-4 描述了裙子上的图案,识别了植物,解释了如何到健身房的某个机器,翻译了标签(并提供了一份食谱),阅读了地图,并执行了许多其他任务,表明它真正理解图像中的内容——如果它被问了正确的问题。它知道裙子的样子,但可能不