幻方量化的子公司深度求索确实发布了全新系列模型DeepSeek-V3并开源。根据多条证据显示,这一事件发生在2024年12月26日。DeepSeek-V3是深度求索公司推出的首个版本模型,并且同步开源。
DeepSeek-V3是一款基于自研MoE(混合专家)架构的大型语言模型,拥有671亿参数,激活参数为37亿,在14.8万亿token的数据规模上进行了预训练。该模型在多项评测中表现出色,其性能不仅超越了多个开源模型,如Qwen-2.5-72B、Llama-3-1.405T、GPT-4o和Claude-3.5-Sonnet,还接近甚至部分超越了闭源模型。
DeepSeek-V3的生成速度相比前代产品V2.5提升了三倍,达到每秒60 token,同时训练成本显著降低,总成本仅为557.6万美元,这使得它在性价比方面具有很大的优势。此外,该模型的API服务定价也相对较低,进一步降低了使用门槛。
DeepSeek-V3的发布标志着深度求索在AI领域的重大突破,并且其开源策略有助于推动AI技术的普及和迭代发展。
幻方量化和深度求索的背景和历史如下:
幻方量化
幻方量化是一家依靠数学与计算机科学进行量化投资的对冲基金公司。其创始团队自2008年起开始探索自动化交易,并在2015年正式创立了幻方量化。公司创立之初,便依靠数学与人工智能进行量化投资,并在2016年首次将深度学习模型应用于实盘交易,使用GPU进行计算。此后,幻方不断壮大其AI团队,转向AI驱动的量化策略,并持续投入AI算法研究。
然而,幻方量化的发展并非一帆风顺。在2021年,公司经历了历史最大回撤,业绩大幅波动引发了市场的广泛关注。幻方量化对此进行了道歉,并表示将