AI日报｜国内大模型迅速崛起！赶超美国第一！阿里云发布全球性能最强的开源模型！

可信AI进展

已于 2024-06-11 11:10:22 修改

阅读量411

点赞数 3

文章标签：人工智能阿里云开源

于 2024-06-11 10:56:37 首次发布

本文链接：https://blog.csdn.net/m0_56647251/article/details/139593401

版权

文章推荐

粽叶飘香，端午安康！AI视频送祝福啦~

AI日报｜文生语音大模型国内外均有突破，Pika完成6亿新融资，视频大模型也不远了！

⭐️搜索“可信AI进展“关注公众号，获取当日最新AI资讯

阿里云发布全球性能最强的开源模型Qwen2-72B！性能超越美国最强开源模型Llama3-70B

6月7日，阿里云通义千问发布全球性能最强的开源模型Qwen2-72B，性能不仅超过美国最强的开源模型Llama3-70B，也超过文心4.0、豆包pro、混元pro等国内闭源大模型。火爆外网！

并且阿里云宣布，开源模型Qwen2从今日起，免费下载！

在预训练语言模型的评估中，对比当前最优的开源模型，Qwen2-72B在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型，如Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B。

开源模型Qwen2亮点：

持续投入提升Qwen的代码及数学能力

在代码方面，成功将CodeQwen1.5的成功经验融入Qwen2的研发中，实现了在多种编程语言上的显著效果提升。

在数学方面，大规模且高质量的数据帮助Qwen2-72B-Instruct实现了数学解题能力的飞升。

长文本处理

Qwen2系列中的所有Instruct模型，均在32k上下文长度上进行训练，并通过YARN或Dual Chunk Attention等技术扩展至更长的上下文长度。

并且开源了一个智能体解决方案，用于高效处理100万tokens级别的上下文。

安全

下图展示了大型模型在四种多语言不安全查询类别中生成有害响应的比例。测试数据来源于Jailbreak，并被翻译成多种语言进行评估。

Qwen2-72B-Instruct模型在安全性方面与GPT-4的表现相当，并且显著优于Mixtral-8x22B模型。

下载地址:https://modelscope.cn/organization/qwen

中国首个自研视频大模型Vidu重大更新：时长延至32秒，首次支持音视频合成

中国首个长时长、高一致性、高动态性的自研视频大模型Vidu，近期完成三个重大技术迭代，实现国内视频模型更大一步技术跨越。更新如下：

一键生成32s视频；
支持音视频合成；
支持4D生成，可以从单一视频生成时空一致的4D内容；

值得关注的是，Vidu正朝着“更长时长”和“更多模态”的方向进化，在视频生成之后，音频生成或将成为Vidu迭代的重点方向。

据介绍，Vidu4D支持从单个生成的视频中精确重构出4D（即序列3D）。通过提升3D一致性，来增强视频生成对世界的真实模拟。

https://mp.weixin.qq.com/s/zOsgAm8v-C44qWhz-TSUsw

对标Sora，快手推出视频生成大模型「可灵」

快手AI团队自研结合多项创新技术，宣布推出可灵大模型，并且采用类似Sora的技术路线。

具有以下优势：

能够生成大幅度的合理运动；可灵采用了3D时空联合注意力机制，能够更好地建模视频中的复杂时空运动；
能够模拟物理世界特性；得益于自研模型架构及Scaling Law激发出的强大建模能力；
具备强大的概念组合能力和想象力；得益于模型对文本-视频语义的深刻理解和基于Diffusion Transformer架构学到的强大概念组合能力；
生成的视频分辨率高达1080p，时长高达2分钟（帧率30fps），且支持自由的宽高比。得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构。
https://36kr.com/p/2807897979434629

业内首个中文原生的DiT架构文生图开源模型——腾讯混元：开源模型生图时间缩短75%！

腾讯混元文生图大模型（混元DiT）开源不足一月，Github收获2.1k星标，位列同类项目前茅。

作为首个中文原生DiT架构的开源商用模型，腾讯快速响应开发者需求，推出了加速库更新：生图生成时间缩短75%，速度提升4倍。

加速器具有两大亮点：

通过降低扩散模型迭代的步数实现加速，使用蒸馏权重后，生成同等质量的图像，迭代步数减半。
TensorRT通过工程优化，减少冗余计算、合并层次、精简精度，让模型更快处理数据，并且TensorRT还支持与模型权重解耦。

https://mp.weixin.qq.com/s/zyTzP6Q9lNORwprPBIc1FA

博查AI搜索首发多模态搜索和智能体搜索能力，引入抖音高质量内容和AI智能体

博查AI搜索发布6.6《鲤跃龙门》版本，首发多模态搜索(Media Search)和智能体搜索(Agent Search)能力，引入抖音高质量内容和AI智能体，进一步增强AI搜索的通用性和结果丰富性。

其亮点如下：

多模态搜索 (Media Search)

在搜热点、搜短剧、搜视频、搜图片等场景下，除了AI总结的文本，从高质量视频、图片中可以获得更直观、更丰富的答案。

智能体搜索 (Agent Search)

在专有领域内容搜索和复杂任务搜索等场景下，通过AI智能体可以达到更优的搜索效果。博查会识别用户搜索需求，并匹配相应的智能体进行作答。

联网搜索API (Web Search API)

博查与国内顶尖搜索引擎厂家合作，第一个正式开放提供内容合规、价格实惠、搜索结果更适合AI使用的联网搜索API。博查搜索引擎基于MoE架构，可以识别用户搜索意图，路由至专家领域进行搜索，并提供高质量的正文文本。

https://mp.weixin.qq.com/s/ALc5

“可信 AI 进展 “ 公众号致力于最新可信人工智能技术的传播和开源技术的培育，覆盖大规模图学习，因果推理，知识图谱，大模型等技术领域，欢迎扫码关注，解锁更多 AI 资讯～

可信AI进展

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
AI日报｜国内大模型迅速崛起！赶超美国第一！阿里云发布全球性能最强的开源模型！

在预训练语言模型的评估中，对比当前最优的开源模型，Qwen2-72B在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型，如Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B。博查搜索引擎基于MoE架构，可以识别用户搜索意图，路由至专家领域进行搜索，并提供高质量的正文文本。“可信 AI 进展 “ 公众号致力于最新可信人工智能技术的传播和开源技术的培育，覆盖大规模图学习，因果推理，知识图谱，大模型等技术领域，欢迎扫码关注，解锁更多 AI 资讯～
复制链接

扫一扫