今年的大模型如雨后春笋般涌现,而近两天AI界最引人注目的事件,无疑是DeepSeek-V2的开源发布。DeepSeek-V2以其强大的性能和经济实用的特性,犹如一匹黑马,迅速赢得了众多业内人士的关注。
欢迎尝鲜体验:DeepSeek、LLama3-8B、LLama3-70B,可以同时体验哦。免费!免费!免费!
PS:DeepSeek的RAG知识库系统能力,相当震撼!
亮点:
✅ 在 AlignBench 中排名前三,超过 GPT-4,接近 GPT-4-Turbo
✅ 在 MT-Bench 中排名前列,可与 LLaMA3-70B 匹敌,超过 Mixtral 8x22B
✅ 擅长数学、代码和推理
✅ 支持 128K 上下文窗口
特点:
✅ 创新的架构,拥有2360亿参数,其中210亿个活跃参数
✅ 无与伦比的 API 价格,同时保持真正的开源和非商业性
综合能力:
在目前大模型主流榜单中,DeepSeek-V2 均表现出色
✅ 中文综合能力(AlignBench)开源模型中最强,与 GPT-4-Turbo,文心 4.0 等闭源模型在评测中处于同一梯队
✅ 英文综合能力(MT-Bench)处于第一梯队,英文综合能力(MT-Bench)与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型 Mixtral8x22B
✅ 知识、数学、推理、编程等榜单结果位居前列
✅ 开源模型支持 128K 上下文,对话官网/API 支持 32K 上下文
评论区回复1,即刻开启免费体验
(同时体验LLama3-8B、LLama3-70B、DeepSeek)