1、起源
Deepseek成立于2023年7月17日,由知名量化资管巨头幻方量化创立。作为大厂外唯一一家储备万张A100芯片的公司,幻方量化为Deepseek的技术研发提供了强大的硬件支持。
2、发展
2024年1月5日:发布Deepseek LLM,包含670亿参数,在推理、编码、数学和中文理解等方面有出色表现。
2024年1月25日-6月17日:依次发布Deepseek-coder、Deepseek-math、Deepseek-vl、Deepseek-v2、Deepseek-coder-v2等多个模型,在代码、数学、视觉-语言等领域取得进展。
2024年9月5日:合并Deepseek-coder-v2和Deepseek-v2-chat两个模型,升级推出Deepseek-v2.5。
2024年12月13日-26日:发布Deepseek-vl2、Deepseek-v3,尤其是Deepseek-v3在性能提升的同时,训练效率和推理速度大幅提升。
2025年1月20日:发布推理大模型DeepSeek -R1,该模型在数学、编程和推理等关键领域能与OpenAI的o1相抗衡,但其总体API调用成本却低了95%左右。
3、现状
Deepseek目前已经成为AI领域的重要创新力量,其多个模型在性能上达到或接近国际领先水平,在全球范围内受到了广泛关注。其应用已登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越ChatGPT。
4、未来趋势
技术创新:继续深化技术研发,在模型性能、算法优化等方面持续创新,可能会推出更高效、更智能的模型,进一步提升在各领域的应用能力。
应用拓展:将模型应用拓展到更多领域,如智能医疗、智能交通、智能金融等,推动AI技术在各行业的普及和落地。
国际合作与竞争:在国际市场上与其他AI企业展开更广泛的合作与竞争,通过开源等方式吸引全球开发者参与,提升其在全球AI领域的影响力。
成本优化:延续其低成本、高效能的优势,进一步探索降低训练和推理成本的方法,使AI技术更易于普及和应用。