DeepSeek怎么学、如何用?请看此文(内附详细学习资源)

为什么各个国家如此重视人工智能技术,尤其是其中的大模型技术?可以想象一下,这个世界如果没有电能会怎么样?大模型技术好比电能,它为未来世界运转提供能量。大模型系统好比一座发电厂,为其他设备的运转提供能源。大模型技术的重要性可想而知。因此,各个国家不惜投入巨大的人力和财力进行研发。之前发布的主流的大模型系统,如OpenAI等,绝大部分是闭源的,这好比建的“发电厂”都是私有的,一般人无法免费使用。此外,构建一个大模型系统花费的人力和财力巨大,费用以千万或亿为单位计,普通人根本不可能构建自己的大模型系统。DeepSeek大模型的横空出世彻底改变了这一现状。首先,DeepSeek完全开源,好比新建的“发电厂”完全免费,这样会极大地促进大模型技术的应用和普及。更为重要的是,DeepSeek极大地降低了大模型系统的构建成本,这意味着普通人都能够构建自己的“发电厂”,可以随心所欲的使用电能。直白地说,DeepSeek使大模型系统不再是奢侈品,而是普通老百姓都能用的日用品。基于DeepSeek人们可以非常便捷和便宜地构建自己的大模型系统。近期,很多单位和公司都基于DeepSeek发布了自己的大模型系统。可以预见,DeepSeek将会引起普通大众的普遍关注,DeepSeek将会极大地为人们的工作和生活提供源源不断的能量,促进生产力的提高。为此,关注并学习DeepSeek就非常有必要。本文将对DeepSeek怎么学及如何用进行通俗解读。同时,还为读者们整理了丰富的DeepSeek学习资源,方便读者进行学习。

本文作者为黄星宇,审校为韩煦和邓镝。

一、DeepSeek有何实用价值

1.内容创作的得力助手

无论是专业写手创作商业文案、新闻报道,还是学生撰写学术论文,DeepSeek都能充当灵感源泉与高效辅助工具。例如,当你准备撰写一篇“数字化转型对传统制造业的影响”的商业分析文章,它能够生成主题和大致框架,再根据框架生成相关行业动态、转型案例及影响分析等内容,帮助创作者完善文章架构与充实论据。具体结果如下图所示。

图1 DeepSeek生成商业分析文案

2.编程开发的智能伙伴

程序员在开发过程中,常遇功能实现难题。例如在下面的场景中,DeepSeek-Coder-6.7B模型有效地从model.py文件中调用类Iris分类器及其成员函数,并利用utils.py文件中的函数,正确地完成main.py文件中的main函数进行模型训练和评估。

图2 DeepSeek在代码中的应用(GIF来源于官方GitHub网站)

3.教育领域的智能导师

在学生学习各学科知识的过程中,难免遇到难题。无论是数学中的立体几何证明、物理中的电磁学问题,还是化学中的化学反应原理分析,DeepSeek都能提供详细解答与思路引导。如下图,学生在学习数列通项公式推导时遇到困难,它能给出具体的解答步骤,比标准答案更加全面的解析。

图3 deepseek在数学解答应用

二、怎样学习 DeepSeek

1.依托教程及操作手册入门

(1)教程和操作手册

教程和操作手册读者可以查阅《DeepSeek15天指导手册—从入门到精通》及《DeepSeek从入门到精通》。相关资料的下载地址如下:

百度盘下载: https://pan.baidu.com/s/1aohwmFEiKXVJ-GNvGL0dmg?pwd=av2g

(2)技术报告和论文

[1] DeepSeek LLM Scaling Open-Source Language Models with Longtermism(2024年1月)

[2] DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model(2024年5月)

[3] DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence(2024年6月)

[4] DeepSeek-V3 Technical Report(2024年12月)

[5] DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(2025年1月)

上述资料,读者可以通过下面的网址进行下载。

百度盘下载: https://pan.baidu.com/s/1ZxdRuYuHlmRXZ5QgzgRVQg?pwd=iuya

2.通过项目实践锻炼技能

可以结合自身兴趣与实际需求,设定一些小型实践项目。例如,对数据分析感兴趣的用户,可以利用DeepSeek与相关数据处理工具,开展一个“分析某电商平台用户购买行为数据”的项目。在项目过程中,运用DeepSeek进行数据清洗、特征提取以及数据分析报告生成等工作,通过实际操作加深对DeepSeek在数据处理领域应用的理解与掌握。

3.加入社区交流实战经验

关注人工智能领域的专业论坛、社交媒体群组以及知名技术博主的分享。在这些平台上,会有关于DeepSeek的最新应用案例、技术解读以及使用技巧分享。例如,在知乎上搜索“DeepSeek应用”话题,能看到众多行业人士对DeepSeek在不同领域应用的深入分析与经验分享。除了知乎,还有小红书,CSDN,GitHub等社区可以进行交流。此外DeepSeek官方声明,社交平台仅有三个账号:微信公众号DeepSeek、小红书DeepSeek、X(Twitter)DeepSeek,其他均为仿冒账号。

三、如何运用DeepSeek

1.借助官方平台操作

(1)网页端使用

打开DeepSeek的官网https://www.deepseek.com/,完成注册登录后,即可进入功能界面,使用相应的功能。例如,若要使用自然语言处理功能,可以在指定文本框内输入问题或指令,如“请为我写一篇500字左右关于春天的散文”,点击提交按钮,稍作等待,便能在页面获取生成的散文内容,具体过程可以浏览如下视频。

DeepSeek网页端使用示例

(2)移动端APP使用

DeepSeek功能支持在官方APP上使用,在应用商店下载安装并登录账号后,其操作流程与网页端相似。APP端界面简洁,更适合在移动设备上随时随地使用。例如,用户在外出途中突然有写作灵感,可立即打开APP,使用自然语言处理功能记录想法或获取创作灵感。

图4 DeepSeek的App界面

学生专属福利:2月20日上线的浙江大学“浙大先生”,采用了本地化部署的DeepSeek V3、R1模型,摆脱了目前常见的服务器繁忙问题。“浙大先生”目前面向829所CARSI联盟高校开放共享,联盟高校师生只需通过校园账号登录即可免费使用满血版的DeepSeek。

官网链接:chat.zju.edu.cn

图5 浙大先生界面

2.使用API拓展应用

依据DeepSeek官方提供的详细API文档进行开发。文档中会明确说明各类接口的请求参数、响应格式以及调用频率限制等关键信息。开发者需按照自身项目需求,合理配置请求参数。例如,在调用图像识别API时,需将待识别图像的路径、格式等信息作为参数准确传递,以获取准确的图像识别结果。同时,要遵循API的使用规范与限制,确保应用程序的稳定运行。

API文档可在链接处查阅:https://api-docs.deepseek.com/zh-cn/

图6 API教程界面

3.部署本地化的DeepSeek平台

使用ollama来进行本地部署

部署教程:https://www.bilibili.com/video/BV1PiNaeTEjn/?spm_id_from=333.337.search-card.all.click&vd_source=a62ba253d6c5c9ac8b2f8876f9378e89(约四分钟)。

参考网络资料,部署DeepSeek-R1需要的硬件配置见下表。表中配置所需硬件参数来源于网络,仅供读者参考,无法保证一定满足部署要求。建议读者部署DeepSeek-R1时,所选硬件参数略高于表中参数为宜。

表1 DeepSeek-R1需要的硬件配置

模型大小

硬盘

显存

推荐显卡

1.5B

1.1GB

6GB

NVIDIA RTX 2060

7B

4.7GB

16GB

NVIDIA RTX 4080

8B

4.9GB

20GB

NVIDIA RTX 4090

14B

9.0GB

32GB

NVIDIA A100(40GB)

32B

20GB

64GB

NVIDIA A100(80GB)

70B

43GB

128GB

2张NVIDIA A100

671B

404GB

640GB

8张NVIDIA A100

四、DeepSeek学习资源

1.教程及操作手册

关于Deepseek的文字教程,读者可以扫描如下链接进行学习。

DeepSeek本地部署,保姆级教程,带你打造最强AI-CSDN博客

Deepseek教程(详细!!!)|使用Ollama下载Deepseek,并在Pycharm使用_ollama下载deep seek-CSDN博客

2.视频教程

关于Deepseek的视频教程,读者可以点击如下网址进行学习。

(1)https://www.bilibili.com/video/BV12QPme7EN9/?spm_id_from=333.337.search-card.all.click&vd_source=a62ba253d6c5c9ac8b2f8876f9378e89

(2)Deepseek教程(详细!!!)|使用Ollama下载Deepseek,并在Pycharm使用_ollama下载deep seek-CSDN博客

### 使用 DeepSeek 构建应用程序 #### 一、理解 DeepSeek 生态系统 DeepSeek 提供了一系列工具和服务来支持开发者构建复杂而智能的应用程序。这不仅限于单一的产品,而是涵盖了多个方面和技术栈,形成了一个完整的生态系统[^2]。 #### 二、基于 DeepSeek-VL 进行开发 对于专注于视觉语言处理领域的开发者来说,DeepSeek-VL 是一个非常有价值的资源。该项目提供了详细的入门指导和实际应用场景示范,使得即使是初者也能迅速掌握核心技术要点并应用于实践当中[^1]。 ```python from deepseek_vl import VisualLanguageModel model = VisualLanguageModel() output = model.process(image_path="example.jpg", text_query="What is this?") print(output) ``` 这段简单的 Python 代码展示了如何加载 `VisualLanguageModel` 类,并通过给定图片路径与查询语句获取返回的结果。 #### 三、创建检索增强生成(RAG)系统实例 当涉及到文档理解和问答系统的建设时,可以考虑采用由 DeepSeek R1 结合 Ollama 所组成的解决方案。这种方法允许用户针对特定文件如PDF或技术手册发起自然语言形式的问题求,并获得精准的回答内容[^3]。 ```python import ollama from deepseek_r1.rag_system import RagSystem rag_instance = RagSystem(ollama_model='path_to_ollama') response = rag_instance.query(document_file="manual.pdf", question="How to configure the network settings?") print(response) ``` 上述脚本说明了初始化 `RagSystem` 对象的过程及其基本用法——指定要使用的Ollama模型位置后即可调用 `query()` 方法传入待解析的文档名称连同具体问题描述作为参数从而得到最终答复。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值