自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1034)
  • 收藏
  • 关注

原创 万字详解MCP:从理论到实战,全网最全讲解,小白也能看懂!

这篇万字长文,我们将全面拆解 MCP 从概念、原理到底层实现,一步步带你理解它为什么是多智能体协作、RAG 系统、任务型对话、智能体编排等场景的「通用语言」和「执行中枢」

2025-05-20 11:07:37 450

原创 初学者入门大模型之从零实现LLM大语言模型,从下载数据到生成文本,保姆级教程!

在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的任务,如写作、翻译、问答等。本文将为你提供一个简单直接的方法,从下载数据到生成文本,带你一步步构建大语言模型。

2025-05-20 10:39:32 443

原创 初学者入门大模型:什么是RAG?

在讲RAG之前,我们先说一个大模型的普遍现象,大家应该都用过大模型了,比如 ChatGPT、DeepSeek、豆包、文心一言等等…

2025-05-20 10:30:39 535

原创 大模型入门必学核心技术:预训练、微调、提示词工程和 RAG,全篇通俗易懂!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-20 10:24:22 307

原创 数据治理 × 知识库 × 大模型:解开企业智能化转型的 “不可能三角”

“数据是新时代的石油,但未经治理的石油会堵塞管道;知识是企业的黄金矿脉,但缺乏提炼的矿石无法兑换价值;大模型是超级引擎,但燃料不足的引擎终将熄火。”—— 唯有四者协同,才能让企业的智能化转型从 “纸上蓝图” 走向 “落地生根”。

2025-05-19 10:30:00 738

原创 全方位总结大模型技术与趋势:一文详解大模型,看完你就是LLM大师!

大模型将成为通用人工智能的重要途径。在这个由0和1编织的数字时代,人工智能的腾飞已不是科技梦想,而是日益切实的现实。其中,大模型作为人工智能的核心力量,正以前所未有的方式重塑着我们的生活、学习和工作。无论是智能语音助手、自动驾驶汽车,还是医疗诊断系统,大模型都是幕后英雄,让这些看似不可思议的事情变为可能。

2025-05-19 09:15:00 836

原创 突然发现大模型RAG常见13种分块策略的思路,真的好清晰!!!

分块策略在RAG中至关重要,目的是提高效率、相关性和上下文保持。分块能减少计算开销,增加检索相关信息的可能性,同时保持信息完整性。但也存在风险,如上下文丢失、冗余和不一致性。选择策略需考虑文档类型(结构化 vs 非结构化)、查询复杂性、资源可用性和期望结果(速度 vs 准确性 vs 上下文)。

2025-05-19 09:00:00 450

原创 大模型面试:RLHF夺命连环17问,答错直接挂!

无论你是准备冲刺大厂,还是深入理解前沿技术,掌握 RLHF 的核心逻辑和落地难点都至关重要。本文梳理 17 道 RLHF 高频面试题+深度解析,助你斩获 offer!

2025-05-18 09:45:00 1527

原创 AI Agent框架混战:九大智能体框架谁将颠覆行业格局?2025开发者、创业团队必看的框架盘点,5步决策锁定你的crush框架

简单来说,AI Agent就像是一个个"数字员工",每个都有自己的专长。而框架就是让这些"数字员工"高效协作的"管理系统"。比如你要开发一个自动写代码的项目,一个Agent负责理解需求,一个负责写代码,还有一个负责测试...它们互相配合,完成任务。

2025-05-18 09:30:00 795

原创 大模型所谓的参数是什么?大模型为什么需要训练?大模型训练到底干了什么?

我们知道大模型是训练出来的,那么哪些训练数据都跑哪去了,大模型训练的过程中都干了什么? 为什么大模型需要训练?‍‍

2025-05-18 09:15:00 515

原创 2025年初学者入门大模型:一文详解大型语言模型的11种微调方法

导读:大型预训练模型是一种在大规模语料库上预先训练的深度学习模型,它们可以通过在大量无标注数据上进行训练来学习通用语言表示,并在各种下游任务中进行微调和迁移。随着模型参数规模的扩大,微调和推理阶段的资源消耗也在增加。针对这一挑战,可以通过优化模型结构和训练策略来降低资源消耗。

2025-05-17 08:30:00 833

原创 提示工程 vs 微调 vs RAG,大模型三种优化方式有什么区别?

提示工程、微调和检索增强生成(RAG)是三种主要优化大型语言模型输出的方法。**提示工程**简单易用,适合一般性话题,但定制性有限。**微调**则提供高度定制和精确响应,但成本和复杂性较高。**RAG** 通过结合外部数据源,提供最新、相关的信息,是一种在提示工程与微调之间的折中方案,特别适合需要动态信息和上下文相关性的场景。选择哪种方法取决于项目需求、资源和预期结果。

2025-05-17 08:30:00 954

原创 AI大模型小白扫盲贴:这些知识请务必扎进脑子里,总有一天会用到

最近普及AI的活动做的很多。但是越多我发现紧靠线下普及效率太低,所以把一些最重要的AI概念汇总一下,并通过我自己个人的理解给到大家,希望帮助小白们快速走进AI领域。

2025-05-17 08:15:00 564

原创 2025年大模型时代开发者进阶秘籍:从新手到高手的成长路径全解析

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-16 10:00:00 721

原创 2025年学习LLM的7大步骤,让你少走99%弯路!!

人工智能(AI)已经深刻影响我们的生活和工作,作为一名有抱负的AI工程师,你可能正在考虑如何高效地学习AI知识,并在这个飞速发展的领域占得一席之地。以下是我基于个人经验的七大步骤建议:

2025-05-16 09:45:00 739

原创 小白学大模型:LLaMA-Factory介绍与使用,建议收藏!

Efficient fine-tuning对于将大型语言模型(LLMs)调整到下游任务中至关重要。然而要在不同模型上实现这些方法需要付出相当大的努力。LLaMA-Factory是一个统一的框架,集成了一套先进的高效训练方法。它允许用户通过内置的Web UI灵活定制100多个LLMs的微调,而无需编写代码。

2025-05-16 09:45:00 1444

原创 2025年程序员转行一定要优先考虑着四个方向,最有发展前景!

对于程序员转行方向的推荐,可以基于当前的技术趋势、市场需求以及程序员的个人技能和兴趣来综合考虑。以下是一些推荐的转行方向:

2025-05-15 10:00:00 607

原创 Dify+DeepSeek-R1: 大模型超强AI工作流,详细的部署与使用实录

Dify是一个开源的LLM应用开发平台,它通过直观的可视化界面,帮助开发者快速构建和部署AI应用,支持包括模型管理、知识库、工作流编排等全方位功能,你可以把它理解为一个类似于扣子的"AI应用的乐高积木系统"。

2025-05-15 09:30:00 547

原创 初学者入门大模型:一次讲清楚!什么是AI模型训练?到底在训练什么?

我们一直惊叹于AI能写文章、能做画、会编程,现在还能生成视频。从宏观上来看,一个完整的通用AI系统如下图所示,在最关键的模型网关处,调用我们已经训练好的模型,进行用户数据交互,反馈最终的结果。所以,结果的好坏,就取决于我们模型的能力水平,因此,2024年我们看到了市场上千模大战的场面,模型的泛化能力正在以天为单位高歌猛进。———————————————— 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接

2025-05-15 08:30:00 670

原创 大模型技术:DeepSeek在数据领域的30个应用场景

在这个数据AI的时代,DeepSeek作为新一代AI模型正在改变我们处理、分析和理解数据的方式。 本文为您揭秘DeepSeek在数据领域的30个颠覆性应用场景,带大家一窥AI如何重塑数据价值链。

2025-05-14 09:45:00 651

原创 一文看懂Qwen3本地部署的配置要求,不知道部署哪个版本的小伙伴看过来!

本次Qwen3系列开源模型一共发布了8个不同尺寸,尺寸越大,显存占用越高。8个模型中有6个Dense(密集)模型,2个MoE(混合专家)模型。密集模型在推理过程中会激活所有参数,而 MoE 模型则采用稀疏激活策略,每次前向传递只激活一部分专家参数,在有限的计算预算下性能更高。

2025-05-14 08:45:00 785

原创 小白入门大模型之GPU的算力是如何算出来的?以及实际应用中的注意事项

什么是算力?GPU算力通常以每秒浮点运算次数(FLOPS)来表示,反映了GPU在执行复杂计算任务时的效率。简单来说,GPU算力就是GPU每秒钟能做多少数学题。当然这里的数学题不是加减乘除,而是更复杂的浮点运算(类似小数计算)和整数运算(类似整数统计)。

2025-05-14 08:00:00 584

原创 2025年大语言模型全景解析,从基础架构到实际应用,一文掌握当前最热门的AI技术!

无论你是AI爱好者还是技术专家,这篇文章将帮你梳理大语言模型的完整知识体系,从基础架构到实际应用,一文掌握当前最热门的AI技术!

2025-05-13 09:30:00 1441

原创 AI大模型入门指南:AI Agent智能体框架选型指南

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-13 09:00:00 924

原创 AI销售智能体+大模型实战指南,看完你就LLM大师!

最近,智谱宣布BigModel开放平台多款大模型产品进行价格调整,率先进入「亿」时代,即模型以“每亿tokens”为单位计价。比如之前《AI销售数据分析神器》中,调用的GLM-Z1-AirX 推理模型,每亿tokens仅500元,更有GLM-4-FlashX,每亿tokens仅10元;GLM-4-Plus 价格更是直降90%,从50元/百万tokens降至5元/百万tokens(相当于每亿tokens500元)。

2025-05-13 08:15:00 846

原创 AI大模型入门教程:一文彻底搞懂“模型蒸馏”,通俗易懂!

通过蒸馏技术,DeepSeek能够将具备强大推理能力的大型教师模型(例如参数规模高达 6710 亿的 DeepSeek R1 大模型)中的核心知识高效压缩并迁移至轻量级学生模型(例如仅含 70 亿参数的 Qwen 7B 模型),在保持推理精度的同时显著降低模型部署成本。

2025-05-12 10:51:38 999

原创 0基础小白入门必看:AI大模型基本概念与工具梳理

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

2025-05-12 10:45:48 920

原创 到底什么是大模型?一分钟带你看懂!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-12 10:43:27 567

原创 大模型实战:Qwen3大模型微调入门实战,保姆级教程,附代码!

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-11 10:30:00 1313

原创 小白也能看懂的AI大模型参数微调全解析,建议收藏!

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

2025-05-11 10:00:00 761

原创 手把手教你大模型如何将杂乱文本变为可视化知识图谱!建议收藏!

知识图谱是一种强大的信息表示工具,通过实体(节点)及其之间的关系(边)来清晰呈现事物间的联系。相比之下,非结构化文本则显得杂乱无章。传统上,从原始文本构建知识图谱并非易事,往往需要人工识别实体和关系,并编写提取规则,或者借助专门的机器学习模型完成任务。然而,大语言模型(LLM)的出现带来了转机。LLM 具备强大的灵活性,非常适合这项任务。它们能够读取自由格式的文本并输出结构化信息。正如本文将展示的,我们可以利用 LLM 构建自动化流程来创建知识图谱。

2025-05-11 09:15:00 761

原创 万字长文!小白也能读懂的混合专家模型(MoE)深度解析

混合专家模型(MoE)作为一种强大的模型架构,正在成为大模型时代的热门话题。本文将带你深入了解MoE的神秘面纱,从其基本概念、核心组件,到训练方法和应用场景,用通俗易懂的语言和生动的实例,让你即使没有深厚的技术背景,也能轻松掌握MoE的关键技术细节。

2025-05-10 10:00:00 624 1

原创 深度解析智能体 AI 的五大层级,看看你用的是哪种?

你的 AI 不仅能帮你写文章,还能自动爬取最新行业数据、进行深度分析,甚至生成商业决策建议!这不再是科幻,而是智能体 AI 正在实现的未来。

2025-05-10 09:15:00 967

原创 AI在教育中的五大应用场景,助力教学与学习全面智能化解决方案

近年来,随着人工智能(AI)技术的迅速发展,教育行业逐步探索AI的应用,尽管在效果上尚有提升空间,但AI在教育中的潜力已经开始显现。随着大模型的不断成熟,AI在教育领域的渗透将加速,优质教育AI产品迎来了爆发期。AI技术的应用不仅能提升教学效率、减轻教师负担,还能提供个性化的学习体验,解决长期以来教育资源分配不均、优质资源稀缺的问题,开启教育行业的新时代。

2025-05-10 09:00:00 822

原创 AI Agent智能体技术全解析:从基础理论到前沿实践,万字详解这篇超强综述!

这篇论文的研究来自 MetaGPT、Montréal & Mila人工智能研究所、南洋理工大学、美国阿贡国家实验室、悉尼大学、宾夕法尼亚州立大学、微软亚洲研究院、伊利诺伊大学厄巴纳-香槟分校、香港科技大学、南加州大学、耶鲁大学、斯坦福大学、佐治亚大学、俄亥俄州立大学、阿卜杜拉国王科技大学、杜克大学、香港理工大学、谷歌 DeepMind 以及加拿大高等研究院(CIFAR)等众多研究者的集体智慧与前瞻思考,历时半年创作而成。

2025-05-10 08:30:00 677

原创 到底什么是大模型?一篇文章告诉你大模型基础概念

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-09 10:00:00 763

原创 深入剖析25种大模型RAG架构,AI工程师该如何选择?

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-09 09:45:00 1775

原创 AI大模型训练三阶段,你都掌握了吗?

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-09 08:45:00 641

原创 AI是什么?——普通人要理解AI,更要拥抱AI

简单来说,人工智能(Artificial Intelligence,简称AI)是指使机器或计算机能够模拟人类智能行为的技术和系统。具体来说,AI通过模拟和模仿人类的学习、思考、决策等过程,来完成一些通常需要人类智慧的任务,比如语音识别、图像处理、语言翻译、自动驾驶等。可以把AI看作是让机器“变聪明”,使其不仅能根据预定规则执行任务,还能在没有人类直接干预的情况下,通过学习和适应,不断优化自己的行为和决策。如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!

2025-05-09 08:00:00 684

原创 大模型面经:SFT和RL如何影响模型的泛化或记忆能力?

如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

2025-05-08 10:23:28 975

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除