//社区生态//
-
国内首个音视频多媒体大模型万兴“天幕”正式发布。万兴科技发布国内首个音视频多媒体大模型万兴“天幕”,支持多种语言,实现音视频创作闭环。
//行业落地//
-
全球首款搭载AI大模型的MPV智能座舱发布。江淮全新MPV瑞风RF8上市发布,拥有全球首款搭载AI大模型的MPV智能座舱,支持多指令语音交互,智能语音可以记录用户去过的地点和播放过的音乐等。
//多模态大模型//
-
Midjourney升级V6。Midjourney专门针对动漫风格升级Niji-Journey V6,具有生成细节丰富的动漫人物和相应风格的文字能力,相比V5版本,V6的3D风格图像效果显著提升。
-
多模态大模型稀疏化后可维持性能。针对大型视觉语言模型LVLM,来自北大和中山大学的研究者联合提出MoE-Tuning训练策略,可构建LVLM对应的稀疏模型,并维持初始模型性能。例如,3B的MoE-LLaVA可媲美LLaVA-1.5-7B。
//智能体//
-
Gemini主要开发者离职创业瞄准智能体。Deepmind核心技术人员、Gemini四大开发者之一的Ioannis Antonoglou从Google离职,筹备创立新公司专研智能体。