在2024年5月13日,美国开放人工智能研究中心(OpenAI)发布了最新版本的ChatGPT——GPT-4o。这一更新标志着人工智能领域的又一重大进步,引起了全球科技界的广泛关注。GPT-4o的“o”代表“omni”(全能),意味着它能够处理文本、音频和图像的任意组合输入,并生成相应的文本、音频和图像回应。这一新版本在与使用者的对话中基本无延迟,能够倾听、实时回应,并且能够感知人的情绪,使得对话体验更加自然和人性化。
GPT-4o的发布,不仅仅是技术上的一次飞跃,它还可能对人工智能领域的应用产生深远的影响。北京邮电大学人机交互与认知工程实验室主任刘伟认为,GPT-4o在文本生成、做题、问答系统以及情感分析等任务中表现出色,预示着人工智能在多个领域的应用将变得更加广泛和深入。此外,OpenAI首席技术官米拉·穆拉蒂(Mira Murati)也在发布会上提到,GPT-4o能够在音频、视觉和文本中进行实时推理,响应时间最短可达232毫秒,平均为320毫秒,与人类对话响应时间相似。
然而,GPT-4o的发布也带来了一些挑战和问题。首先是算力与能源问题,AI能力的实现背后是算力资源的支撑,而OpenAI长期以来一直面临算力资源紧张的问题。此外,网络环境的差异也会影响用户体验,不同国家的网络环境可能导致速度隔绝。还有AI获取最新信息的问题,这对于实现人机无缝交互至关重要。最后,复杂的国际环境和政策问题也可能对AI应用的落地产生影响。
尽管存在挑战,GPT-4o的发布无疑为人工智能领域带来了新的机遇。OpenAI表示,GPT-4o的文本和图像功能将免费向所有用户推出,Plus用户将享受更高的调用额度。此外,未来几周内,基于GPT-4o改进的语音模式也将向Plus用户推出。OpenAI的这一举措,将进一步推动人工智能技术的普及和应用。
通过智创聚合API平台(s.lconai.com),用户可以体验到GPT-4o实时推理能力,以及快速响应速度。智创聚合API平台不仅为开发者提供了一个探索人工智能新领域的机会,也为企业提供了一个提升产品智能化水平的平台。