20240402 每日AI必读资讯

🤖 腾讯将人形机器人写进计划里
- 腾讯发布《2024数字科技前沿应用趋势》报告。
- 腾讯将就三维感知数据和腾讯的混元大模型或开源大模型LLAMA2-7B优化策略控制层。
- 腾讯这两年做了灵巧手、机械臂(相当于人形机器人上半身的手臂控制能力),也做了各种四足机器人。
🔗 88页深度报告,看懂2024数字科技前沿应用趋势

🗣️微软对Azure AI语音服务升级 发布9种更真实的AI语音
- 对中文支持已经很完美。
🔗详细:http://xiaohu.ai/p/5432

🚀 Mini-Gemini:简单有效的AI框架,增强多模态视觉语言模型
- Vision Language Models(VLMs)融合了计算机视觉(CV)和自然语言处理(NLP)的独特集成。
- Mini-Gemini采用双编码器系统和新颖的补丁信息挖掘技术,优化多模态输入处理。
- 在多个零样本基准测试中表现出色,超越了现有模型。
🔗项目入口:https://top.aibase.com/tool/minigemini
🔗论文地址:https://arxiv.org/abs/2403.18814

image.png

🌐最神秘国产大模型团队冒泡 一出手就是两个王炸!
- 阶跃星辰专注多模态融合和Scaling Law,开发出千亿参数的ToC产品。
- 产品包括跃问聊天类应用和冒泡鸭AI开放世界平台。
- Step系列通用大模型表现突出,支持多模态理解和内容创作。
🔗跃问产品入口:https://top.aibase.com/tool/yuewen
🔗冒泡鸭产品入口:https://top.aibase.com/tool/maopaoyaai

图片

💬上海人工智能实验室发布一套多模态 LLM 视觉评价体系MMStar
- 全面评估视觉语言模型在6个核心能力和18个具体维度上的多模态能力。
- 小模型TinyLLaVA-3B的表现出乎意料地好。
- 两个新的评估指标:多模态收益(MG)和多模态泄漏(ML)。
🔗 项目地址:https://mmstar-benchmark.github.io/
🔗 https://blink.csdn.net/details/1672591

🌌OPPO 发布移动推理引擎Transformer-Lite
- 专为在手机上高效部署大型语言模型设计。
- 在智能手机上提供智能助手、文本摘要、翻译等功能。
🔗 https://arxiv.org/abs/2403.20041
🔗 https://blink.csdn.net/details/1672592

  • 4
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值