大家好,我是吾鳴。
之前吾鳴给大家分享过浙江大学出品的两份报告,它们分别是:
《DeepSeek行业应用案例集-解锁智能变革密码》
今天吾鳴给大家分享一份由浙江大学出品的第三份报告——《Chatting or Acting?DeepSeek的突破边界与浙大先生的未来图景》。报告主要从DeepSeek的技术创新与架构、性能优势与全球影响力、从大模型到智能体的进化、教育领域的深度整合——“浙大先生”、未来场景与生态建设以及战略趋势与行业影响等六个方面全面的介绍了DeepSeek。报告一共85页PPT,文末有完整版下载地址。
内容摘要
- DeepSeek的技术创新与架构
重点介绍DeepSeek的模型架构,包括MoE(混合专家)架构、MLA(多头潜在注意力)机制,以及工程优化策略(如流水线并行、通信优化、内存管理)。通过多Token预测、长上下文扩展等技术提升训练效率和推理性能,同时采用FP8混合精度训练降低成本。 - 性能优势与全球影响力
DeepSeek作为高性能、低成本的开源大模型,在多项榜单中与顶尖闭源模型媲美,全球下载量及用户增长迅速。开源生态支持多场景适配(如昇腾芯片、国内云平台),并通过模型蒸馏降低推理成本(仅为OpenAI的3%)。 - 从大模型到智能体的进化
分析LLM(大语言模型)的局限,提出智能体(Agent)需具备自主决策、多模态交互、长期记忆等能力,并设计开发平台支持不同复杂度智能体的构建(如青铜级到王者级应用)。强调智能体在任务执行、个性化服务、系统整合等场景的核心作用。 - 教育领域的深度整合——“浙大先生”
以浙江大学为例,展示DeepSeek在教学全流程的应用:课前智能生成预习题目,课中动态调整教学重点,课后智能批改与学情分析。结合“学在浙大”“智云课堂”等平台,提供AI学伴、口语对话训练(ETalk)等工具,赋能个性化学习与高效教学管理。 - 未来场景与生态建设
规划AI创意创作(短视频生成、音乐创作)、代码助手(VSCode集成)、智慧校园(AI辅助机械设计、校园服务智能体)等场景。通过“方舟”大模型服务平台支持模型微调与行业适配,推动与芯片厂商、云计算巨头、教育联盟(如CARSI)的合作,构建全球化AI生态。 - 战略趋势与行业影响
指出人工智能进入产业化阶段,算法创新(如非Transformer架构)成为突破点,算力效率拐点显现。强调低参数量模型推动终端本地化部署,中国技术路径在打破西方垄断中的关键作用。
报告精彩
报告无套路下载地址:夸克网盘分享