哈尔滨工业大学DeepSeek公开课：探索大模型原理、技术与应用从GPT到DeepSeek

本文链接：https://blog.csdn.net/weixin_59191169/article/details/147062919

2月28日，哈尔滨工业大学举办了“大模型原理、技术与应用——从GPT到DeepSeek”主题讲座，邀请哈工大人工智能研究院副院长、计算学部赛尔实验室副主任车万翔教授作为主讲嘉宾，500余名师生代表现场听取报告，超5万人次线上直播观看。该讲座在哈尔滨工业大学B站视频号的播放量累计达14万，抖音平台点赞加收藏近40万。

以下是对这些核心内容的简要概述：

1、自然语言处理的概念和发展历史

语言是人类交流思想、表达情感最自然、最深刻、最方便的工具。人类历史上大部分知识都是以语言文字形式记载和流传的。语言不仅是人类有史以来最大的技术发明之一，也是继真核细胞之后最伟大的进化成就。

2、什么是自然语言处理？

自然语言处理（NLP）是指用计算机来理解和生成自然语言的各种理论和方法。NLP属于认知智能的范畴，是人类和动物的主要区别之一，需要更强的抽象和推理能力。

3、GPT的创新与挑战

GPT（Generative Pre-trained Transformer）是OpenAI在2018年提出的一个重要模型，它采用语言模型预训练任务，通过计算一个句子在语言中出现的概率或给定上文预测下一个词出现的概率，学到了知识、语义、推理和情感等方面的信息。

尽管GPT-3在多个任务上表现出色，但它也存在一些不足，如缺乏知识推理能力和可解释性。例如，在回答“烤箱和铅笔哪个更重？”这样的问题时，GPT-3可能会给出错误的答案。

4、ChatGPT的关键核心技术

为了解决这些问题，OpenAI在2022年推出了ChatGPT。ChatGPT的核心技术包括无监督学习、有监督学习和强化学习。通过这些技术，ChatGPT能够更好地遵循人类指令，生成多样化的结果，并在未见过的任务上表现出色。

5、DeepSeek-R1的突破

DeepSeek-R1是由中国研发的大型语言模型，它在性能上可与OpenAI的GPT模型媲美。DeepSeek-R1通过模仿人类推理过程，能够逐步生成响应，在解决科学问题时表现得更为出色。DeepSeek-R1的核心技术包括思维链（Chain-of-Thought, COT）和强化学习（RL），这些技术使得模型在推理任务上具有更高的准确性和泛化性。

6、未来发展方向

自然语言处理的发展正从面向自然语言的处理转变为基于自然语言的智能。未来，大模型的发展方向将包括智能体、具身智能、决策机、情感个性化、轻量化、价值观对齐等。同时，随着技术的进步，大模型将在医疗、航天等领域发挥更大的作用。

总之，大语言模型作为人工智能的基石，正在推动自然语言处理技术向更高层次的发展。从GPT到DeepSeek，我们看到了技术的不断进步和应用的不断拓展。未来，随着技术的进一步创新和应用，大模型将在更多领域展现出其巨大的潜力。

篇幅有限以上只是部分内容概览

我的DeepSeek部署资料已打包好（自取↓）
https://pan.quark.cn/s/7e0fa45596e4

但如果你想知道这个工具为什么能“听懂人话”、写出代码甚至预测市场趋势——答案就藏在大模型技术里！

❗️为什么你必须了解大模型？

1️⃣ 薪资爆炸：应届大模型工程师年薪40万起步，懂“Prompt调教”的带货主播收入翻3倍

2️⃣ 行业重构：金融、医疗、教育正在被AI重塑，不用大模型的公司3年内必淘汰

3️⃣ 零门槛上车：90%的进阶技巧不需写代码！会说话就能指挥AI

（附深度求索BOSS招聘信息）
在这里插入图片描述

⚠️警惕：当同事用DeepSeek 3小时干完你3天的工作时，淘汰倒计时就开始了。

那么，如何系统的去学习大模型LLM？

作为一名从业五年的资深大模型算法工程师，我经常会收到一些评论和私信，我是小白，学习大模型该从哪里入手呢？老师啊，我自学没有方向怎么办？老师，这个地方我不会啊。如果你也有类似的经历，一定要继续看下去！当然这些问题啊，也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点，给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢，我就曾放空大脑，以一个大模型小白的角度去重新解析它，采用基础知识和实战项目相结合的教学方式，历时3个月，终于完成了这样的课程，让你真正体会到什么是每一秒都在疯狂输出知识点。

篇幅有限，⚡️ 朋友们如果有需要全套《2025全新制作的大模型全套资料》，扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套资料呢，会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程，带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念，用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇，你将掌握RAG、Agent、Langchain、大模型微调和私有化部署，学习如何构建外挂知识库并和自己的企业相结合，学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目（已脱敏），比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等，从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢，会给大家一个小福利，课程视频中的所有素材，有搭建AI开发环境资料包，还有学习计划表，几十上百G素材、电子书和课件等等，只要你能想到的素材，我这里几乎都有。我已经全部上传到CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述
相信我，这套大模型系统教程将会是全网最齐全最易懂的小白专用课！！