OpenAI刚刚发布了GPT-4o,这是一种新的人工智能模式,集合了文本、图片、视频、语音的全能模型
。能够实时响应用户的需求,并通过语音来实时回答你,你可以随时打断它。还具有视觉能力
,能识别视觉物体并根据视觉作出快速的响应和应答
,具有非常强的逻辑推理能力。它的比GPT4-turbo快2倍,价格便宜50%!
下面有一些视频和案例介绍,其中GPT-4o 驱动的 ChatGPT 扮演人类一样的助理,通过录屏和听语音,像真人助理一样,可以记录理解对话、还能参与互动,发表自己的建议!这才是真正的 AI 陪伴,你无需再把 ChatGPT 当作一个 AI 程序,它就是一个独立的 AI 智能体
,你需要的时候它就出现,就像你的私人助理一样,它能记住你的习惯
,而且有自己的思考和逻辑
。这一切有赖于 GPT-4o 推理音频、视频(连续图片)和文本的提速,将这种混合的实时数据流交互体
验带给大家,这就像我们直播互动和打字互动的区别。
我们看几个案例:
1、理解场景并唱生日快乐,这语气词感觉比真人还真
2、代码和数据分析能力展示,这能力简直了,以后有啥问题直接上GPT
3、数学理解能力,这技术发展下去还要什么培训老师
4、超强的场景理解能力,以后感觉跟GPT-4o聊天就能有很多不错的建议
5、可汗学院的可汗和他儿子一起使用了 GPT-4o 辅导孩子在可汗学院上做数学题,一步步启发纠正,各种鼓励,比普通家长辅导效果可能真的要好不少!
6、跟着 GPT-4o 学西班牙语,以后学习都变得更有趣了
7、体验下GPT-4o的实时翻译能力
8、GPT-4o充当智能语音客服,这么发展下去都不需要请客服处理售后问题了,全部人工智能处理了
往期推荐
美国商务部再次将37家中国企业加入制裁清单,涉及量子通信,卫星导航,无人机,高空气球等
实际硬件设计中非常经典巧妙的20个电路合集,带分析,收藏起来慢慢看!(二)