OpenAI最新发布的GPT-4V模型为ChatGPT增添了语音和图像功能,为用户提供了更多在日常生活中使用ChatGPT的方式。这次更新将为用户带来更加便捷、直观的交互体验,用户可以直接通过拍照上传图片,并提出相关问题。OpenAI的最终目标是构建一个安全、有益的人工通用智能(AGI),因此他们将逐步推出语音和图像功能,并随着时间的推移不断改进和完善系统的风险。
GPT-4V模型在医疗领域的应用令人振奋。微软的评测人员通过提示"描述图像"来评估GPT-4V在医学图像理解领域的性能。在测试中,GPT-4V成功识别了X射线中的牙齿和颌骨。更令人印象深刻的是,当评测人员询问"在这个X射线图像中是否有需要拔除的智齿?"时,GPT-4V能够通过视觉上下文进行推理,并得出智齿没有完全长出牙龈的结论。这种结合专业知识的能力使得GPT-4V成为一种强大的工具,可以帮助医学专业人员识别常见病症并生成相应的报告,从而减轻他们在撰写报告时的工作负担。
(GPT-4V 识别 X 射线中的牙齿与颌骨)
(GPT-4V 识别图像中是否有智齿)
医疗领域是多模态大模型的重要应用领域,这一点通过微软对GPT-4V在医疗行业的测评得到了印证。医学影像分析、医学诊断和治疗以及医学大数据分析都可以借助多模态大模型的能力而得到有效