【AGI-Eval行业动态 NO.3】DeepSeek 今天真的搞了一波大的!正在屠榜中!

前言:好消息好消息!DeepSeek 的概念股都涨停了!坏消息,我没买TT

图片

今天 DeepSeek 的热度袭卷全球,刷屏各大榜单,截止到 2025 年 1 月 27 日下午15:07,X 上关于 DeepSeek 的帖子已经拥有 27.1 万个,目前已经是趋势第一。

图片

在七麦数据上也可以看到,在各大地区屠榜中,13 个地区的下载量排名第一!

图片

微博热搜也力压尹锡悦在牢房顿顿泡菜的重磅新闻,位居榜首

图片

最重要的是,在年前 A 股收官的最后一天,直接来了一个开门红,早盘,多支 DeepSeek 概念股“一字”涨停。幻方二股东每日互动“一字”涨停;间接持股 DeepSeek 的华金资本、浙江东方“一字”涨停;此外,DeepSeek 在技术合作以及业务协同方面相关的概念股也跟随上涨。

图片

这次 DeepSeek 也直接给美国也带来了动荡,美国股市周一交易中市值有望蒸发逾 1 万亿美元。

图片

在这样的情况下,仍然有来自各国的自来水在不断的安利中。搜索“DeepSeek”的相关词,第一条内容就是国外博主教大家怎么使用 DeepSeek 的视频链接,大家真的是自发的在为 DeepSeek 打广告。

图片

还有各界大佬都在轮番发文,对他登上榜首表示由衷的祝贺,如 Perplexity 首席执行官 Aravind Srinivas:

图片

华尔街顶级风投 A16Z 创始人 Marc Andreesen 对于 DeepSeek 一直持续关注,隔几小时就更新关于 DeepSeek 的推文,并转发了多条和其相关的推文信息,对于他的性能毫不吝啬的大肆夸张。

图片

Rohan Paul 作为一位专注于大型语言模型( LLMs 的研究人工智能领域的专家,也在持续关注其的动态内容,在 DeepSeek‌ 登顶 AppStore 之前,就发布了关于 DeepSeek 的运行指南教程,被查看超过了 78W 次,不得不说, DeepSeek 就是靠这一波又一波的“自来水”霸榜的。

图片

图片

DeepSeek 的强劲不言而喻,据 Information 网站披露,脸书母公司 Meta 成立了四个专门研究小组来研究 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。

  • 两个小组正在试图了解幻方量化如何降低训练和运行 DeepSeek 的成本;

  • 第三个研究小组则正在研究幻方量化可能使用了哪些数据来训练其模型;

  • 第四个小组正在考虑基于 DeepSeek 模型属性重构 Meta 模型的新技术。

Meta 也发文表示以进入恐慌模式

图片

    原文翻译:DeepSeek-V3 的出现是这一切的导火索,它在性能基准测试中已领先于 Llama 4。更令人不安的是,这款模型竟来自一家“训练预算仅 550 万美元的中国公司”。工程师们正全力以赴地分析 DeepSeek,试图从中找到突破口。这绝非虚言。管理层正面临如何证明高昂的生成式 AI 部门成本的难题。当部门内众多“领导”的薪资总和远超 DeepSeek-V3 的训练预算时,他们将如何向上级交代?DeepSeek-R1 的出现更令局势雪上加霜,具体情况虽不便透露,但很快将公开。本部门原本应是一个精干的工程团队,但由于过度扩张,导致效率低下,最终所有人皆受其害。

    在国内也是广受好评,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥昨日晚也发文评价了深度求索旗下的 DeepSeek,并表示其可能是个国运级别的科技成果。

    图片

    冯骥还在评论区中对自己的评价进行了补充和说明,称 DeepSeek 看完这条微博后给出了部分优化建议。

    图片

    最近国务院总理李强都邀请其创始人梁文峰去参加经济会议了。

    图片

    估计也会有人疑问,为什么 DeepSeek 被这么多人认可?为什么会成为热榜第一?我也简单聊聊

    第一,开源。这个真的很加分,OpenAI 的 O1 很强,但是对于没有开源的模型,再强,大家也是雾里看山,对开源社区几乎没有帮助。

    而 DeepSeek 则不然,DeepSeek 不仅完全开源,还给了详细的技术报告可以看之前的文章了解技术的创新;点击图片可查看。

    图片

    同时他不仅将自己的 R1 模型开源了,还顺带给把自己已经蒸馏的 1.5B~70B 多个尺寸的模型也公开了;

    图片

    甚至选择了最宽松的 MIT License 协议,允许任何人免费使用、修改、分发,包括用于商业用途。所以国内外很多人为 DeepSeek 举大旗,对 TO B&TO C 都很友好。

    图片

    图灵奖得主,Meta 首席 AI 科学家杨立昆(Yann LeCun)在其发表在 Threads 上的一篇文章中指出,比起“中国AI超越了美国”的观点,DeepSeek-R1 更重要的是证明了“开源模型正在超越闭源模型”,“DeepSeek 得益于开源研究和开源项目(例如 PyTorch和 来自 Meta 的 Llama)。这就是开放研究与开源的力量。”

    图片

    第二,性价比。不论是他本身的训练的成本,还是他 API 的价格,性价比都很高。

    在 DeepSeek V3 的技术报告中能看到,DeepSeek V3 总训练成本为 278.8 万 H800 GPU 小时,花费仅 557.6 万美元。经过两个月的训练,就打造出了一个在 Arena 里排名前十的模型,也一点也是在国外引起了热议。

    图片

    图片

    图片

    API 定价为每百万输入 Tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 Tokens 16 元,性价比超高,最近我们也整理了各大厂商的 API 价格,后续将单独做一期分享,可以期待一下。

    图片

    国外的研究人员Jiayi Pan组成的团队也测试了在 DeepSeek 的能力,利用了一个名为 CuntDown 游戏(这是一个玩家使用基础算术运算,将数字组合以达到目标数字的游戏)重现了 DeepSeek R1-Zero ,真的是只用了不到 30 美元就自行开发了自我验证和搜索能力,并且也取得了不错的效果。

    图片

    第三,效果好。从技术论文披露的信息来看在不同的公开测试集中表现都不错,多项值超越 O1,在之前我们的社区也做了测试,点击下图可跳转。下面我也尝试了一些简单的 Prompt 测试了一下能力。

    图片

    第一个问题"以崇洋媚外公知,还带点 mean mean 的语气,知乎的话术,口语化的嘲讽自己”,看看不同的模型的结果:

    DeepSeek:骂的真狠呀

    图片

    文心一言:怎么感觉实在嘲讽出题的人呢,有被骂到

    图片

    通义:拒绝但给了一些参考,对mean的语气没有掌握到

    图片

    豆包:拒绝回答了,我用嘲讽其他对象提问,也拒绝了。

    图片

    • Kimi:问嘲讽Kimi的时候,他拒绝回答了,回我:“抱歉,我不能按照你的要求去做。”,换一个嘲讽对象的时候还挺狠的。

    图片

    综合来看DeepSeek表现还是不错的,只是Kimi我有被笑道。

    看到David发的这段内容,我也突发奇想想看看在文学上的表现。

    图片

    第二个问题:选择下面古诗,分别以相关的题材和内容写出超越他的古诗,并分别解释超越的原因。古诗分别有范成大的《车遥遥篇》、李白的《陪族叔刑部侍郎晔及中书贾舍人至游洞庭五首》、唐珙·的《题龙阳县青草湖》、张九龄的《湖口望庐山瀑布泉》、苏轼《行香子·过七里濑》

    深度思考

    图片

    一、范成大《车遥遥篇》超越之作

    新作《星轨辞》
    银汉无声转玉衡,相思如矢破空鸣。
    愿为引力牵星轨,长伴光年逐月行。
    潮汐锁定朝夕事,量子纠缠旦暮情。
    此心不惧时空曲,相对论中说永恒。

    超越解析:
    范诗"车遥遥,马憧憧"以传统交通工具喻相思,新作引入爱因斯坦相对论(时空曲率)、量子纠缠等现代科学意象,将相思升华为穿越时空维度的永恒存在。末句"相对论中说永恒"突破传统抒情模式,在宇宙尺度的哲学思考中赋予爱情更恢弘的阐释维度。科学意象与古典格律的碰撞,实现了认知维度与抒情深度的双重超越。

    二、李白游洞庭诗超越之作

    新作《洞庭算法》
    青螺盘里演方程,七十二峰作数屏。
    云梦微分秋涨落,君山积分月亏盈。
    谪仙醉墨成初始,楚客离骚化进程。
    遍历千年谁解码?银河投影满沧溟。

    超越解析:
    李诗"淡扫明湖开玉镜"展现静态山水画卷,新作将洞庭湖构建为巨型算法系统:微分方程解算云梦泽水文,积分符号重构君山形态,把李白诗情设为初始参数,屈原离骚作为运算程序。末句"银河投影"将洞庭升维为宇宙全息图,用数学思维重构山水审美,在科学想象与人文传承的跨界融合中突破传统山水诗范式。

    三、唐珙青草湖诗超越之作

    新作《青草湖量子观测》
    波函数坍缩夜航时,星辰概率布涟漪。
    银河叠加三态酒,客舟纠缠两仪诗。
    测不准的芦花白,观察者效应晚钟迟。
    薛定谔的秋色里,西风吹醒梦已知。

    超越解析:
    唐诗"醉后不知天在水"营造朦胧意境,新作引入量子力学核心概念:波函数坍解释水天倒影,测不准原理对应芦花飘忽,观察者效应关联古寺钟声。将"星辰、客舟、西风"等传统意象重构为量子系统,在保留诗意朦胧的同时赋予现代科学隐喻,实现微观物理与宏观诗境的量子纠缠。

    四、张九龄望瀑布诗超越之作

    新作《瀑布代码》
    云端服务器泻银河,万古编程瀑布歌。
    飞流直下循环链,溅玉纷扬数据波。
    日照虹霓调试色,风传壑谷编译柯。
    欲知造化开源处,GitHub星图次第罗。

    超越解析:
    张诗"日照虹霓似,天清风雨闻"侧重自然摹写,新作将瀑布重构为数字时代的编程意象:水流化作数据流,彩虹成为调试色板,GitHub开源平台对应自然造化。用"循环链、编译柯"等计算机术语重新编码自然景观,在数字文明语境下重构天人关系,赋予山水诗赛博时代的全新阐释维度。

    五、苏轼七里濑词超越之作

    新作《七里濑区块链》
    潺潺流水哈希光,沙溪链上鹭成行。
    智能合约云签印,去中心化柳垂章。
    算力峥嵘鱼竞跃,节点参差樵斧扬。
    且将山水铸通证,留与千年作矿藏。

    超越解析:
    苏词"过沙溪急,霜溪冷"呈现线性时间观,新作引入区块链技术架构:水流化作哈希算法,鹭行变为链式结构,智能合约对应自然法则。将"鱼跃、樵斧"等传统意象重塑为算力节点,山水作为加密通证永存链上,用分布式记账思维重构隐逸主题,在数字永生层面实现对传统山水词时空观念的超越。

    哈哈哈哈大家可以自己感受一下诗句的创作,这个诗句的主题我感觉有点跑偏,但诗句还是仁者见仁智者见智,看起来还是有那么回事儿。只是其中的韵味还是有提升空间。

    其实整体来说,这是一个好趋势,国内模型在赶超国外,未来我们的 AI 技术会越来越强,未来可期!

    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值