20240402 每日AI必读资讯

最新推荐文章于 2024-05-05 06:26:45 发布

程序员的店小二

最新推荐文章于 2024-05-05 06:26:45 发布

阅读量734

点赞数 4

文章标签：人工智能

本文链接：https://blog.csdn.net/m0_46163918/article/details/137242006

版权

🤖 腾讯将人形机器人写进计划里
- 腾讯发布《2024数字科技前沿应用趋势》报告。
- 腾讯将就三维感知数据和腾讯的混元大模型或开源大模型LLAMA2-7B优化策略控制层。
- 腾讯这两年做了灵巧手、机械臂（相当于人形机器人上半身的手臂控制能力），也做了各种四足机器人。
🔗 88页深度报告，看懂2024数字科技前沿应用趋势

🗣️微软对Azure AI语音服务升级发布9种更真实的AI语音
- 对中文支持已经很完美。
🔗详细：http://xiaohu.ai/p/5432

🚀 Mini-Gemini:简单有效的AI框架，增强多模态视觉语言模型
- Vision Language Models（VLMs）融合了计算机视觉(CV)和自然语言处理(NLP)的独特集成。
- Mini-Gemini采用双编码器系统和新颖的补丁信息挖掘技术，优化多模态输入处理。
- 在多个零样本基准测试中表现出色，超越了现有模型。
🔗项目入口：https://top.aibase.com/tool/minigemini
🔗论文地址：https://arxiv.org/abs/2403.18814

🌐最神秘国产大模型团队冒泡一出手就是两个王炸！
- 阶跃星辰专注多模态融合和Scaling Law，开发出千亿参数的ToC产品。
- 产品包括跃问聊天类应用和冒泡鸭AI开放世界平台。
- Step系列通用大模型表现突出，支持多模态理解和内容创作。
🔗跃问产品入口：https://top.aibase.com/tool/yuewen
🔗冒泡鸭产品入口：https://top.aibase.com/tool/maopaoyaai

💬上海人工智能实验室发布一套多模态 LLM 视觉评价体系MMStar
- 全面评估视觉语言模型在6个核心能力和18个具体维度上的多模态能力。
- 小模型TinyLLaVA-3B的表现出乎意料地好。
- 两个新的评估指标：多模态收益(MG)和多模态泄漏(ML)。
🔗 项目地址：https://mmstar-benchmark.github.io/
🔗 https://blink.csdn.net/details/1672591

🌌OPPO 发布移动推理引擎Transformer-Lite
- 专为在手机上高效部署大型语言模型设计。
- 在智能手机上提供智能助手、文本摘要、翻译等功能。
🔗 https://arxiv.org/abs/2403.20041
🔗 https://blink.csdn.net/details/1672592

程序员的店小二

关注

4
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
20240402 每日AI必读资讯

腾讯将就三维感知数据和腾讯的混元大模型或开源大模型LLAMA2-7B优化策略控制层。- Mini-Gemini采用双编码器系统和新颖的补丁信息挖掘技术，优化多模态输入处理。- 阶跃星辰专注多模态融合和Scaling Law，开发出千亿参数的ToC产品。- 全面评估视觉语言模型在6个核心能力和18个具体维度上的多模态能力。- Step系列通用大模型表现突出，支持多模态理解和内容创作。- 两个新的评估指标：多模态收益(MG)和多模态泄漏(ML)。- 小模型TinyLLaVA-3B的表现出乎意料地好。
复制链接

扫一扫