🤖 腾讯将人形机器人写进计划里
- 腾讯发布《2024数字科技前沿应用趋势》报告。
- 腾讯将就三维感知数据和腾讯的混元大模型或开源大模型LLAMA2-7B优化策略控制层。
- 腾讯这两年做了灵巧手、机械臂(相当于人形机器人上半身的手臂控制能力),也做了各种四足机器人。
🔗 88页深度报告,看懂2024数字科技前沿应用趋势
🗣️微软对Azure AI语音服务升级 发布9种更真实的AI语音
- 对中文支持已经很完美。
🔗详细:http://xiaohu.ai/p/5432
🚀 Mini-Gemini:简单有效的AI框架,增强多模态视觉语言模型
- Vision Language Models(VLMs)融合了计算机视觉(CV)和自然语言处理(NLP)的独特集成。
- Mini-Gemini采用双编码器系统和新颖的补丁信息挖掘技术,优化多模态输入处理。
- 在多个零样本基准测试中表现出色,超越了现有模型。
🔗项目入口:https://top.aibase.com/tool/minigemini
🔗论文地址:https://arxiv.org/abs/2403.18814
🌐最神秘国产大模型团队冒泡 一出手就是两个王炸!
- 阶跃星辰专注多模态融合和Scaling Law,开发出千亿参数的ToC产品。
- 产品包括跃问聊天类应用和冒泡鸭AI开放世界平台。
- Step系列通用大模型表现突出,支持多模态理解和内容创作。
🔗跃问产品入口:https://top.aibase.com/tool/yuewen
🔗冒泡鸭产品入口:https://top.aibase.com/tool/maopaoyaai
💬上海人工智能实验室发布一套多模态 LLM 视觉评价体系MMStar
- 全面评估视觉语言模型在6个核心能力和18个具体维度上的多模态能力。
- 小模型TinyLLaVA-3B的表现出乎意料地好。
- 两个新的评估指标:多模态收益(MG)和多模态泄漏(ML)。
🔗 项目地址:https://mmstar-benchmark.github.io/
🔗 https://blink.csdn.net/details/1672591
🌌OPPO 发布移动推理引擎Transformer-Lite
- 专为在手机上高效部署大型语言模型设计。
- 在智能手机上提供智能助手、文本摘要、翻译等功能。
🔗 https://arxiv.org/abs/2403.20041
🔗 https://blink.csdn.net/details/1672592