为什么各个国家如此重视人工智能技术,尤其是其中的大模型技术?可以想象一下,这个世界如果没有电能会怎么样?大模型技术好比电能,它为未来世界运转提供能量。大模型系统好比一座发电厂,为其他设备的运转提供能源。大模型技术的重要性可想而知。因此,各个国家不惜投入巨大的人力和财力进行研发。之前发布的主流的大模型系统,如OpenAI等,绝大部分是闭源的,这好比建的“发电厂”都是私有的,一般人无法免费使用。此外,构建一个大模型系统花费的人力和财力巨大,费用以千万或亿为单位计,普通人根本不可能构建自己的大模型系统。DeepSeek大模型的横空出世彻底改变了这一现状。首先,DeepSeek完全开源,好比新建的“发电厂”完全免费,这样会极大地促进大模型技术的应用和普及。更为重要的是,DeepSeek极大地降低了大模型系统的构建成本,这意味着普通人都能够构建自己的“发电厂”,可以随心所欲的使用电能。直白地说,DeepSeek使大模型系统不再是奢侈品,而是普通老百姓都能用的日用品。基于DeepSeek人们可以非常便捷和便宜地构建自己的大模型系统。近期,很多单位和公司都基于DeepSeek发布了自己的大模型系统。可以预见,DeepSeek将会引起普通大众的普遍关注,DeepSeek将会极大地为人们的工作和生活提供源源不断的能量,促进生产力的提高。为此,关注并学习DeepSeek就非常有必要。本文将对DeepSeek怎么学及如何用进行通俗解读。同时,还为读者们整理了丰富的DeepSeek学习资源,方便读者进行学习。
本文作者为黄星宇,审校为韩煦和邓镝。
一、DeepSeek有何实用价值
1.内容创作的得力助手
无论是专业写手创作商业文案、新闻报道,还是学生撰写学术论文,DeepSeek都能充当灵感源泉与高效辅助工具。例如,当你准备撰写一篇“数字化转型对传统制造业的影响”的商业分析文章,它能够生成主题和大致框架,再根据框架生成相关行业动态、转型案例及影响分析等内容,帮助创作者完善文章架构与充实论据。具体结果如下图所示。
图1 DeepSeek生成商业分析文案
2.编程开发的智能伙伴
程序员在开发过程中,常遇功能实现难题。例如在下面的场景中,DeepSeek-Coder-6.7B模型有效地从model.py文件中调用类Iris分类器及其成员函数,并利用utils.py文件中的函数,正确地完成main.py文件中的main函数进行模型训练和评估。
图2 DeepSeek在代码中的应用(GIF来源于官方GitHub网站)
3.教育领域的智能导师
在学生学习各学科知识的过程中,难免遇到难题。无论是数学中的立体几何证明、物理中的电磁学问题,还是化学中的化学反应原理分析,DeepSeek都能提供详细解答与思路引导。如下图,学生在学习数列通项公式推导时遇到困难,它能给出具体的解答步骤,比标准答案更加全面的解析。
图3 deepseek在数学解答应用
二、怎样学习 DeepSeek
1.依托教程及操作手册入门
(1)教程和操作手册
教程和操作手册读者可以查阅《DeepSeek15天指导手册—从入门到精通》及《DeepSeek从入门到精通》。相关资料的下载地址如下:
百度盘下载: https://pan.baidu.com/s/1aohwmFEiKXVJ-GNvGL0dmg?pwd=av2g
(2)技术报告和论文
[1] DeepSeek LLM Scaling Open-Source Language Models with Longtermism(2024年1月)
[2] DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model(2024年5月)
[3] DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence(2024年6月)
[4] DeepSeek-V3 Technical Report(2024年12月)
[5] DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(2025年1月)
上述资料,读者可以通过下面的网址进行下载。
百度盘下载: https://pan.baidu.com/s/1ZxdRuYuHlmRXZ5QgzgRVQg?pwd=iuya
2.通过项目实践锻炼技能
可以结合自身兴趣与实际需求,设定一些小型实践项目。例如,对数据分析感兴趣的用户,可以利用DeepSeek与相关数据处理工具,开展一个“分析某电商平台用户购买行为数据”的项目。在项目过程中,运用DeepSeek进行数据清洗、特征提取以及数据分析报告生成等工作,通过实际操作加深对DeepSeek在数据处理领域应用的理解与掌握。
3.加入社区交流实战经验
关注人工智能领域的专业论坛、社交媒体群组以及知名技术博主的分享。在这些平台上,会有关于DeepSeek的最新应用案例、技术解读以及使用技巧分享。例如,在知乎上搜索“DeepSeek应用”话题,能看到众多行业人士对DeepSeek在不同领域应用的深入分析与经验分享。除了知乎,还有小红书,CSDN,GitHub等社区可以进行交流。此外DeepSeek官方声明,社交平台仅有三个账号:微信公众号DeepSeek、小红书DeepSeek、X(Twitter)DeepSeek,其他均为仿冒账号。
三、如何运用DeepSeek
1.借助官方平台操作
(1)网页端使用
打开DeepSeek的官网https://www.deepseek.com/,完成注册登录后,即可进入功能界面,使用相应的功能。例如,若要使用自然语言处理功能,可以在指定文本框内输入问题或指令,如“请为我写一篇500字左右关于春天的散文”,点击提交按钮,稍作等待,便能在页面获取生成的散文内容,具体过程可以浏览如下视频。
DeepSeek网页端使用示例
(2)移动端APP使用
DeepSeek功能支持在官方APP上使用,在应用商店下载安装并登录账号后,其操作流程与网页端相似。APP端界面简洁,更适合在移动设备上随时随地使用。例如,用户在外出途中突然有写作灵感,可立即打开APP,使用自然语言处理功能记录想法或获取创作灵感。
图4 DeepSeek的App界面
学生专属福利:2月20日上线的浙江大学“浙大先生”,采用了本地化部署的DeepSeek V3、R1模型,摆脱了目前常见的服务器繁忙问题。“浙大先生”目前面向829所CARSI联盟高校开放共享,联盟高校师生只需通过校园账号登录即可免费使用满血版的DeepSeek。
官网链接:chat.zju.edu.cn
图5 浙大先生界面
2.使用API拓展应用
依据DeepSeek官方提供的详细API文档进行开发。文档中会明确说明各类接口的请求参数、响应格式以及调用频率限制等关键信息。开发者需按照自身项目需求,合理配置请求参数。例如,在调用图像识别API时,需将待识别图像的路径、格式等信息作为参数准确传递,以获取准确的图像识别结果。同时,要遵循API的使用规范与限制,确保应用程序的稳定运行。
API文档可在链接处查阅:https://api-docs.deepseek.com/zh-cn/
图6 API教程界面
3.部署本地化的DeepSeek平台
使用ollama来进行本地部署
参考网络资料,部署DeepSeek-R1需要的硬件配置见下表。表中配置所需硬件参数来源于网络,仅供读者参考,无法保证一定满足部署要求。建议读者部署DeepSeek-R1时,所选硬件参数略高于表中参数为宜。
表1 DeepSeek-R1需要的硬件配置
模型大小 | 硬盘 | 显存 | 推荐显卡 |
1.5B | 1.1GB | 6GB | NVIDIA RTX 2060 |
7B | 4.7GB | 16GB | NVIDIA RTX 4080 |
8B | 4.9GB | 20GB | NVIDIA RTX 4090 |
14B | 9.0GB | 32GB | NVIDIA A100(40GB) |
32B | 20GB | 64GB | NVIDIA A100(80GB) |
70B | 43GB | 128GB | 2张NVIDIA A100 |
671B | 404GB | 640GB | 8张NVIDIA A100 |
四、DeepSeek学习资源
1.教程及操作手册
关于Deepseek的文字教程,读者可以扫描如下链接进行学习。
DeepSeek本地部署,保姆级教程,带你打造最强AI-CSDN博客
Deepseek教程(详细!!!)|使用Ollama下载Deepseek,并在Pycharm使用_ollama下载deep seek-CSDN博客
2.视频教程
关于Deepseek的视频教程,读者可以点击如下网址进行学习。
(2)Deepseek教程(详细!!!)|使用Ollama下载Deepseek,并在Pycharm使用_ollama下载deep seek-CSDN博客