
DeepSeek 学习笔记
文章平均质量分 97
DeepSeek 实战应用
youcans_
电子出版社《数字图像处理—基于OpenCV/Python》作者
展开
-
【DeepSeek应用】腾讯 QBot 浏览器的安装与使用
腾讯推出 QBot 浏览器,集成了腾讯混元大模型和 DeepSeek 模型,在浏览时提供提供AI搜索、AI浏览、AI办公、AI学习和AI写作五大核心功能,旨在为用户提供更智能、高效的浏览体验,,帮助用户更高效地获取和处理信息,满足工作、学习等需求。原创 2025-05-20 08:59:23 · 746 阅读 · 0 评论 -
【DeepSeek论文精读】11. 洞察 DeepSeek-V3:扩展挑战和对 AI 架构硬件的思考
本文介绍 DeepSeek 论文"洞察 DeepSeek-V3:扩展挑战和对 AI 架构硬件的思考"。本文深入分析了DeepSeek-V3/R1模型架构及其AI基础设施,重点阐述了多项关键创新原创 2025-05-18 17:59:06 · 1127 阅读 · 0 评论 -
【DeepSeek论文精读】10. DeepSeek-Coder-V2: 突破闭源模型在代码智能领域的障碍
DeepSeek-Coder-V2是由DeepSeek团队于2024年6月发布的开源混合专家(MoE)代码大模型,旨在突破闭源模型在代码智能领域的障碍。本文详细介绍DeepSeek-Coder-V2模型的技术报告,并给出使用示例。原创 2025-05-14 11:26:05 · 757 阅读 · 0 评论 -
【DeepSeek应用】微信 AI 助手的添加与使用
微信上线“腾讯元宝”新功能,用户可以在微信中添加“腾讯元宝”为好友,直接在微信聊天界面与其进行互动。原创 2025-04-20 07:00:00 · 1255 阅读 · 0 评论 -
【DeepSeek应用】用 DeepSeek 轻松玩转可视化图表(2)流程图甘特图思维导图
DeepSeek Chat 可以生成 图表代码,复制到本地环境运行,就生成可视化图表。上篇介绍条形图、柱状图、饼状图 等常用统计分析图表,本文介绍流程图、甘特图、思维导图等图形的制作。原创 2025-04-16 17:45:36 · 950 阅读 · 0 评论 -
【DeepSeek应用】用 DeepSeek 轻松玩转可视化图表(1)折线图柱状图饼状图
基于 Deepseek 制作可视化图表带来变革,让我们可以“一句话生成专业图表”:自然语言驱动,多输出模式,无缝衔接工作流。本文介绍 Deepseek 生成 HTML 代码、Python 程序来制作可视化图表的方法。原创 2025-04-14 07:30:00 · 2013 阅读 · 0 评论 -
【DeepSeek论文精读】9. DeepSeek-GRM:推理时扩展的通用奖励建模
DeepSeek-AI 发表论文 "Inference-Time Scaling for Generalist Reward Modeling(推理时扩展的通用奖励模型)",提出了一种 "自原则批判调优(SPCT)" 技术,使奖励模型在推理阶段能够动态扩展计算资源。本研究表明 “推理时扩展” 在通用 RM 中的有效性,性能超越训练时扩展。原创 2025-04-07 08:00:00 · 1109 阅读 · 0 评论 -
【DeepSeek应用】DeepSeek 文献检索实战教程(CherryStudio+Zotero)
本文以博主的研究课题为例,实战记录基于 DeepSeek 的文献检索过程。对话过程使用 "CherryStudio" 平台,调用 "硅基流动" 部署的 Deepseek-R1 模型。原创 2025-03-27 08:00:00 · 2032 阅读 · 0 评论 -
【DeepSeek应用】DeepSeek 搭建个人知识库(Ollama+CherryStudio)
通过搭建个人知识库,让 DeepSeek 与私有数据结合,可以实现更专业的、更智慧的、私人定制的大模型。本文详细讲解 采用 CherryStudio 搭建 Deepseek 个人知识库的流程,并通过实例代码进行演示。原创 2025-03-24 16:13:22 · 2328 阅读 · 0 评论 -
【DeepSeek应用】100个 DeepSeek 官方推荐的工具箱
DeepSeek官方工具箱(Awesome DeepSeek Integration)是 DeepSeek 官方收集和整理的各种实用工具列表的清单。本项目由 DeepSeek 官方团队负责维护,里面提供了超过 100 种经过官方认证的插件工具,并且提供了详细的使用教程,包括集成案例,例如:应用程序、ai Agent 框架、RAG 框架、浏览器插件、VS Code 插件等。原创 2025-03-18 08:30:00 · 4528 阅读 · 0 评论 -
【Deepseek应用】Zotero+Deepseek 阅读和分析文献(下)
本篇详细介绍 Deepseek+Zotero 的集成和使用,以及本地部署。结合 Zotero的文献管理和 DeepSeek 的语义理解,可以轻松实现文献核心观点提取、跨文献知识关联可视化,分析未来研究方向。原创 2025-03-08 21:43:25 · 3542 阅读 · 4 评论 -
【DeepSeek应用】Zotero+Deepseek 阅读与分析文献(上)
Zotero 作为一款免费开源的文献管理工具,具有强大的功能和灵活的扩展性,特别是可以集成 DeepSeek 进行 AI辅助文献阅读。本文将从安装与配置开始,详细介绍如何利用 Zotero 及其插件打造高效的文献阅读与研究环境。原创 2025-03-07 14:11:58 · 3086 阅读 · 0 评论 -
【DeepSeek论文精读】8. 原生稀疏注意力(NSA)
2025年 2月,DeepSeek 发布最新论文提出一种新的注意力机制 NSA,用于超快长上下文训练和推断的本地可训练的稀疏注意力机制,还具有与硬件对齐的特点。NSA 融合动态分层稀疏策略,结合粗粒度token压缩和细粒度token选择,兼顾全局上下文感知与局部精度,改进了传统稀疏注意力设计。原创 2025-03-04 07:00:00 · 979 阅读 · 0 评论 -
【DeepSeek论文精读】7. 总结:DeepSeek 的发展历程与关键技术
本系列前文已经逐篇介绍了从 DeepSeek LLM、DeepSeek MoE、DeepSeek V2、DeepSeek V3 到 DeepSeek R1 的内容。本文围绕 DeepSeek 系列论文和模型的发展历程,从基础架构探索、混合专家(MoE)优化、高效推理突破、强化学习驱动 四个阶段 进行总结和分析,原创 2025-02-11 07:00:00 · 5154 阅读 · 0 评论 -
【DeepSeek应用】我与 DeepSeek 的初次交流
如何更好地使用 DeepSeek,使之真正能成为生产力工具和个人专家助理。就DeepSeek 辅助博客写作提纲进行了对话和交流,结果确实令人震撼。原创 2025-02-10 07:00:00 · 2398 阅读 · 0 评论 -
【DeepSeek论文精读】5. DeepSeek-V3 技术报告
DeepSeek-V3是一款强大的混合专家(MoE)语言模型,总参数量为6710亿,在性能上超越了其他开源模型,并达到了与领先闭源模型相当的水平。DeepSeek-V3不仅采用多头潜在注意力MLA和深度探索MoE架构,还开创了无辅助损失的负载均衡策略。原创 2025-02-09 08:00:00 · 11235 阅读 · 0 评论 -
【DeepSeek论文精读】4. DeepSeek-V2:强大、经济且高效的混合专家语言模型
DeepSeek-V2 是一个混合专家(MoE)语言模型,采用多头潜在注意力(MLA)和 DeepSeek 混合专家 (MoE) 的创新架构,在资源利用和性能之间达到很好的平衡。DeepSeek-V2 支持 128K 长度的上下文,具有强大的性能,经济训练和高效推理的特点。原创 2025-02-08 14:44:43 · 2464 阅读 · 0 评论 -
【DeepSeek论文精读】3. DeepSeekMoE:迈向混合专家语言模型的终极专业化
论文提出了MoE语言模型的DeepSeekMoE架构,目的是实现终极的专家专业化(expert specialization)。通过细粒度的专家分割和共享专家隔离,DeepSeekMoE相比主流的MoE架构实现了显著更高的专家专业化和性能。原创 2025-02-07 12:12:03 · 3690 阅读 · 0 评论 -
【DeepSeek论文精读】2. DeepSeek LLM:以长期主义扩展开源语言模型
论文介绍了DeepSeek LLMs,这是一系列在2万亿标记的英语和中文大型数据集上从头开始训练的开源模型。本文深入解释了超参数选择、扩展定律以及做过的各种微调尝试。校准了先前工作中的扩展定律,并提出了新的最优模型/数据扩展-缩放分配策略。原创 2025-02-07 06:30:00 · 4754 阅读 · 2 评论 -
【DeepSeek论文精读】6. DeepSeek R1:通过强化学习激发大语言模型的推理能力
本文由 youcans@xidian 对论文 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 进行摘编和翻译。该论文版权属于原文期刊和作者,本译文只供研究学习使用。原创 2025-02-03 14:27:56 · 7676 阅读 · 0 评论 -
【DeepSeek应用】DeepSeek R1 本地部署(Ollama+Docker+OpenWebUI)
DeepSeek 本地部署在性能、成本和安全等方面具有显著优势。本文详细讲解 基于 Ollama+Docker+OpenWebUI 的本地化部署流程,并通过实例代码演示。原创 2025-02-01 20:53:01 · 76391 阅读 · 43 评论 -
【DeepSeek论文精读】1. 从 DeepSeek LLM 到 DeepSeek R1
DeepSeek R1 推理大模型的发布颠覆了我们的认知。本文介绍从 DeepSeek LLM、DeepSeek MoE、DeepSeek V2、DeepSeek V3 到 DeepSeek R1 的发展历程。本系列将逐篇解读 DeepSeek 论文和模型。原创 2025-01-29 14:31:31 · 44291 阅读 · 0 评论