DeepSeek-V2.5 最好的开源LLM？

新加坡内哥谈技术

于 2024-09-13 00:10:16 发布

阅读量340

点赞数 7

文章标签：人工智能自然语言处理语言模型

本文链接：https://blog.csdn.net/2301_79342058/article/details/142188625

版权

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

量化对冲基金“飞高资本管理”旗下的AI分支DeepSeek，正式推出了最新版本的模型——DeepSeek-V2.5。这是一个在前代模型基础上进行增强的版本，整合了DeepSeek-V2-0628和DeepSeek-Coder-V2-0724的功能。

https://huggingface.co/deepseek-ai

2024年9月6日发布的这个新模型，集成了通用语言处理和编码功能，成为一个功能强大的工具。据第三方研究人员测试和观察，DeepSeek-V2.5目前被认为是开源领域中最先进的大语言模型（LLM）之一。它现已在Hugging Face平台上开放，用户可以通过网页或API无缝访问。

这一版本的发布正值另一场争议中，HyperWrite公司创始人兼CEO马特·舒默于9月5日宣称其模型Reflection 70B是“全球最强的开源AI模型”，这一内部基准测试结果却遭到了独立研究者和更广泛AI社区的质疑，目前尚未有研究者能够重现这些数据。

功能和性能大幅提升

DeepSeek-V2.5针对写作、指令执行和高级编码等任务进行了优化，特别注重与人类偏好的对齐。通过一系列的改进，模型在几乎所有基准测试中均表现优异。

尤其值得一提的是，DeepSeek-V2.5引入了函数调用功能，使其能够更高效地与外部工具进行交互，扩展了模型在实时天气报告、翻译服务和编写算法代码等领域的应用。

CNRS的AI/ML/数据工程师Maziyar Panahi在社交平台X上称赞该模型是“全球最佳的开源LLM”，并表示对此前模型并未引起更多关注感到意外，认为其性能突破性极高。

DeepSeek的巅峰之作

据《金融时报》报道，DeepSeek的母公司飞高资本是拥有超过10,000台[Nvidia] A100处理器的六家中国公司之一，而这些计算资源正被充分用于推动开源AI研究的进步。

DeepSeek-V2.5在自然语言处理（NLP）和编程任务上表现出色，内部测试和外部评估显示，模型在以下关键指标中名列前茅：

AlpacaEval 2.0：DeepSeek-V2.5的准确率为50.5，优于前代DeepSeek-V2-0628（46.6）和DeepSeek-Coder-V2-0724（44.5）。
ArenaHard：模型准确率为76.2，相较于其前代68.3和66.3有显著提升。
HumanEval Python：在此项测试中，DeepSeek-V2.5取得了89分，显示出其在编程能力上的重大进步。

在语言对齐方面，DeepSeek-V2.5在中国的内部评估中，表现优于GPT-4o mini和ChatGPT-4o-latest。

AI观察员Shin Megami Boson也表示，他在一项模仿研究生级别的Google-Proof Q&A基准测试中，DeepSeek-V2.5超越了Meta的Llama 3-70B Instruct和Llama 3.1-405B Instruct，但略逊于OpenAI的GPT-4o mini、Claude 3.5 Sonnet和OpenAI的GPT-4o。

广泛的应用与商业前景

DeepSeek-AI已在Hugging Face上以MIT许可证的变体开源了DeepSeek-V2.5，开发者和组织可以自由使用这一模型，甚至在商业环境中使用，但需遵守某些限制。许可证允许全球范围内的非独占、免版税的版权和专利权使用，包括分发、复制和再授权的权利，但禁止军事用途、生成虚假信息以及利用模型对特定群体的漏洞。

这一举措表明了DeepSeek-AI致力于将先进的AI能力民主化。企业可以将该模型应用于自动化客户支持、内容生成、软件开发和数据分析等各种任务。

为了在本地运行DeepSeek-V2.5，用户需要拥有BF16格式设置和80GB的GPU（8块GPU才能完全发挥模型的性能）。该模型在大规模推理和小批量本地部署方面都进行了高度优化。

DeepSeek-V2.5的架构创新之一是多头潜在注意力（MLA），它通过减少KV缓存来显著提高推理速度，同时保持模型的性能不受影响。这种压缩技术不仅提高了计算资源的利用率，也使模型在资源消耗上更为经济。

DeepSeek-V2.5树立了开源大语言模型的新标准，结合尖端技术创新和实际应用场景，成为企业和开发者的理想选择。

新加坡内哥谈技术

关注

7
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
DeepSeek-V2.5 最好的开源LLM？

AI观察员Shin Megami Boson也表示，他在一项模仿研究生级别的Google-Proof Q&A基准测试中，DeepSeek-V2.5超越了Meta的Llama 3-70B Instruct和Llama 3.1-405B Instruct，但略逊于OpenAI的GPT-4o mini、Claude 3.5 Sonnet和OpenAI的GPT-4o。这是一个在前代模型基础上进行增强的版本，整合了DeepSeek-V2-0628和DeepSeek-Coder-V2-0724的功能。
复制链接

扫一扫