CCF论坛：《夜话Deepseek：技术原理与未来发展》（了解Deepseek必读！）

婷小主的保镖的学习日记

于 2025-02-04 16:35:42 发布

阅读量1.3k

点赞数 24

文章标签：大模型 Deepseek 强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_56184997/article/details/145440228

版权

文章目录

一、关于Deepseek R1的思考和启发
二、大规模强化学习技术原理与大模型技术发展
三、Deepseek系统软件优化总结
四、从Deepseek看大模型软硬件优化
五、有关于Deepseek“打响第一枪”背后的一些关键问题

在看完CCF论坛：《夜话Deepseek：技术原理与未来发展》，个人也是有很多的启发和思考，本人就该次会议而言，进行了一些总结和思考，如有错误，敬请指正！
会议回放链接：在微信中搜索“中国计算机学会”，打开视频号，查看其“直播回放”，找到“夜话Deepseek”。

一、关于Deepseek R1的思考和启发

在这里插入图片描述

R1是目前唯一具有强推理能力和联网搜索的产品，并具有很强的回答能力。
强推理模型最终的落脚点大概率是agent，怎么用抢强推理模型帮助agent更好更鲁棒是一个非常重要的问题。
总结：总的来说，未来几年的主要发展趋势就是强推理模型，如何构建一个高效的agent是所有从事大模型研究的同学老师最需要深度思考的一个问题。

二、大规模强化学习技术原理与大模型技术发展

在这里插入图片描述

以上就是Deepseek R1的一个训练流程，使用deepseek v3基座模型，利用大规模强化学习创造性的实现了Deepseek-R1-Zero和 Deepseek-R1。
ChatGPT的预训练大模型时代已经过去，未来就是强推理大模型的时代。
摩尔定律普遍存在，不仅仅是在芯片行业中存在，在电池、AI行业中也是普遍存在。
总结：所以，在未来所有行业中，AGI（通用人工智能）一定能够实现普遍化。

三、Deepseek系统软件优化总结

接下来，我们来对Deepseek进一步深度了解。
我们可以看见deepseek v3的训练成本实际上是非常低的。
以上deepseek使用的MOE架构实际上大大降低了计算资源。
deepseek使用以下四种主要系统优化方法：

四、从Deepseek看大模型软硬件优化

下面是Deepseek的论文主要框架：
绕过了cuda?
我们来看一下什么是PTX和CUDA?
在编程中，上层应用又是如何调用底层硬件的？
CUDA相对来说，是一个面向用户的上层的接口，用户可以利用CUDA来调用底层的接口（比如间接调用GPU的底层功能（如流处理器指令、显存操作））。
PTX（Parallel Thread Execution，并行线程执行）是隐藏在CUDA Driver更底层的中间汇编语言，可以来直接操纵底层的硬件。
以C语言和Python语言实现一个冒泡排序的例子来说明，越接近底层的代码实现算法的速度更快、使用内存越小，这也说明了底层优化的一个非常重要的意义。
下面是人工智能发展历程，得益于影响其发展的"三驾马车"------算力、算法、数据
像国外已经有一个完整的生态闭环，从模型到芯片再到系统；
而国内的系统和芯片还是比较欠缺的，无法实现闭环；
未来的发展趋势一定是实现国内闭环，模型-芯片-系统闭环；
未来工作：实现软硬件协同，一定是一个非常火热的方向。

五、有关于Deepseek“打响第一枪”背后的一些关键问题

（1）deepseek最有亮点的技术？

大规模强化学习 -> 强推理能力
软软和硬件结合 -> 软硬件协同 -> 硬件极致优化
架构创新 -> MOE架构 -> 解决负载均衡问题
底层优化 -> 上层模型发展 -> 模型效果优化

（2）deepseek有哪一些启示？

硬件架构是否能够国产化？-这是一定能够实现的
AGI（通用人工智能）-未来发展前景
要学习deepseek的态度和创新、坚持。

婷小主的保镖的学习日记

博客等级

码龄4年

29
原创

428
点赞

296
收藏

1286
粉丝

关注

私信

热门文章

分类专栏

从零构建知识图谱：基于知识图谱的医疗问答系统实战教程 5篇

最新评论

深度学习如何复现代码
婷小主的保镖的学习日记: 1、linux环境的包你可以去找找对应windows版本的包，一般的包应该都没有windows和linux版本之分吧，基本都是跨平台的。 2、linux系统和windows就是两个不同的操作系统，你要是在windows上使用pycharm和anconda创建虚拟环境那就是针对window系统的，linux上使用pycharm和anconda创建虚拟环境那就是针对linux系统的；主要就是看你是在哪一个平台上进行操作的。
深度学习如何复现代码
like1_sunny: 如果环境配置中，有linux环境下所需要的包，是不是只能在linux环境下运行？我有点不太明白，pycharm和anaconda创建的虚拟环境是不是只是针对windows系统的？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。