大模型日报 2024-06-28-CSDN博客

本文链接：https://blog.csdn.net/weixin_40262196/article/details/140026765

大模型日报

2024-06-28

大模型资讯

1.寒武纪1号诞生：谢赛宁Yann LeCun团队发布最强开源多模态LLM
谢赛宁 Yann LeCun 团队发布了寒武纪1号，这是一个开源的多模态LLM模型。该模型以视觉为中心，探索了多种不同的视觉编码器及其组合，并设计了一种动态且可感知空间的新型连接器，将视觉特征与LLM整合在一起。团队还开发了一个以视觉为中心的基准评测工具CV-Bench。该模型在多个基准上表现出色，尤其擅长以视觉为中心的任务。

🔗：https://www.jiqizhixin.com/articles/2024-06-28-5

炸裂！讯飞现场大秀强干扰语音识别，星火4.0霸榜八个榜单，74种语言自由交流
科大讯飞的星火4.0在语音识别和个性化AI助手方面取得了突破。语音识别在强干扰场景下的准确率达到了91%，并且支持74种语言的自由交流。个性化AI助手基于用户画像和个人资料进行增强学习，提供个性化的表达和内容。此外，科大讯飞还在医疗和教育领域应用中取得了进展，提供医疗问答、学生学习辅导等功能。讯飞星火APP已经成为人们日常生活中使用的工具之一，具备写作、编程、工作、学习等多种实用功能。

🔗：http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247736139&idx=2&sn=cbdba96b6db088f5d670be14221c1c6d&chksm=e9e9a6d640489c7bab01363c6d666a6589725c088d350cf5e80cdf5c0b4ea3e446cea54765b2&scene=0#rd

字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型
苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集，其中字节大模型团队的单目深度估计模型 Depth Anything V2入选。该模型在细节处理上更精细，鲁棒性更强，并且速度上有显著提升。经过工程优化后，在iPhone 12 Pro Max上的推理速度达到了31.1毫秒。该模型可以应用在自动驾驶、3D建模、增强现实、安全监控以及空间计算等领域。

🔗：https://www.jiqizhixin.com/articles/2024-06-28-11

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、经济！
谷歌发布了Gemini家族的新成员Gemma 2，提供了90亿和270亿参数的两个版本，具有卓越的性能和高效的推理能力。Gemma 2在同等体积类别中表现出色，能够与体积超过其两倍的模型竞争。它还具有低成本、高速推理和易于部署等特点。谷歌提供了广泛的框架兼容性，使其能够轻松与主要的AI框架结合。开发者可以在Google Cloud上轻松部署和管理Gemma 2，并通过Gemma Cookbook获取实用示例和指南。谷歌还向开发者开放了Gemini 1.5 Pro的200万token上下文窗口访问权限。

🔗：https://www.jiqizhixin.com/articles/2024-06-28-15