白交 梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
“2024年上半年对标GPT-4”,这是23年科大讯飞全球1024开发者节现场给出的承诺。
今天,2024刚开年,讯飞星火就迎来重大升级:
讯飞星火V3.5整体接近GPT-4 Turbo;
数学、语言理解、语音交互能力超过GPT-4 Turbo;
代码达到GPT-4 Turbo 96%;
多模态达到GPT-4V 91%。
尤其在语音交互功能上,超逼真的真人语音生成,直接让线上网友惊叹三连:
还有更多实用功能,比如现场几十秒的时间生成22页PPT!这速度,很快啊……
而围绕着这个大模型底座,科大讯飞还有一揽子产品和场景应用输出。
国产首个语音大模型
星火开源大模型“星火开源-13B”
讯飞翻译机升级
面向教育行业的智慧黑板
……
从基础模型到应用场景,下面一起来看。
讯飞星火V3.5底座能力升级
讯飞星火V3.5除了七大能力全面提升,整体能力接近GPT-4,还特别在语言理解、数学等能力上实现超越。
尤其对中文的理解更占优势,具体数据对比如下:
语言理解、数学能力超过GPT-4 Turbo;
代码打到GPT-4 Turbo 96%;
多模态理解达到GPT-4V 91%
……
如果看数据图表还不够直观,我们也提前实测了一番。
就拿此次网友最为称道,也是本次更新最大的亮点——全语音交互,不是语音消息那样一条一条的,而是像打电话一样实时交互,下面先来看一段视频演示:
星火这一波应对得怎么样,算不算得上高情商?
要注意视频没有做加速处理,讯飞星火V3.5的语音响应就是这么快,与ChatGPT的语音交互相比,省去了大量“等待AI思考”这个环节,整个对话过程更流畅。
“聆飞逸”、“聆小玥”分别对应男女声两种音色,可自由切换。在音色自然,还像人一样时不时有停顿、“嗯……”等语气词。
在有感情,拟人度等方面,对比ChatGPT的“Ember”、“Juniper”音色也不遑多让。
在交互模式