- 博客(653)
- 资源 (1)
- 收藏
- 关注
原创 掌握 C(2+1)D 模型结构——用“拆解3D卷积”实现高效视频理解的经典思路
空间(H, W) + 时间(T)但3D卷积有一个非常明显的问题:计算量大参数多训练困难把3D卷积拆成“2D空间卷积 + 1D时间卷积”但效果却接近甚至优于3D卷积。将3D卷积分解为“空间卷积 + 时间卷积”的时空建模方法参数少计算快↓↓↓↓↓将复杂的3D时空建模拆解为“空间理解 + 时间理解”先理解“是什么”,再理解“怎么动”C(2+1)D是一种非常经典且高效的视频建模方法,它通过将3D卷积拆解为2D空间卷积与1D时间卷积,不仅降低了计算复杂度,还提升了模型的表达能力与训练稳定性。
2026-06-12 09:10:47
10
原创 了解视频分类任务与数据集——从数据组织到时空建模的完整认知
在计算机视觉中,视频理解是比图像理解更进一步的任务。识别“这一张图是什么”识别“一段视频在做什么”视频不再是静态信息,而是:空间信息(每一帧画面)时间信息(帧与帧之间变化)时空联合建模问题对一段视频整体进行类别预测的任务最经典的视频动作识别数据集之一Google推出的大规模视频数据集↓↓↓↓↓视频分类任务是计算机视觉中从“图像理解”迈向“时空理解”的重要一步,它需要模型同时理解空间结构与时间变化,因此比图像分类复杂得多。本文系统讲解了:1、视频分类任务定义;2、与图像分类区别;
2026-06-12 09:10:10
61
原创 【自动驾驶领域】学习 Cityscapes 数据集——城市街景语义理解的标准基准
Cityscapes它几乎是语义分割任务中“城市道路场景”的标准基准之一,被广泛用于:自动驾驶感知系统语义分割模型评估(U-Net / DeepLab / SegFormer)城市环境理解研究Cityscapes 就是城市街景语义分割的标杆数据集用于城市街景语义理解的高质量像素级标注数据集Cityscapes是自动驾驶领域最重要的语义分割数据集之一,它以高分辨率城市街景为核心,提供了精细的像素级标注,是评估语义分割模型能力的重要基准。本文系统讲解了:1、Cityscapes基本概念;
2026-06-12 09:09:42
73
原创 使用语义分割经典模型 HRNet 训练道路分割模型并测试使用——从高分辨率特征到工程落地实践
下采样提语义 → 上采样恢复分辨率高分辨率细节在下采样过程中容易丢失尤其是在道路分割任务中,这种细节非常关键,例如:车道线路沿小型障碍物行人边界为了解决这个问题,HRNet(High-Resolution Network)被提出。始终保持高分辨率特征的语义分割网络HRNet是一种非常重要的语义分割模型,它通过“始终保持高分辨率特征 + 多尺度融合”的方式,有效解决了传统编码器-解码器结构中细节丢失的问题,尤其适用于道路分割这类需要高精度边界的任务。本文系统讲解了:1、HRNet基本原理;
2026-06-12 09:09:32
87
原创 学习 LPRNet 框架——轻量级车牌识别网络从结构到工程落地
在智能交通与自动驾驶的感知系统中,车牌识别(License Plate Recognition,简称 LPR)是一个非常典型的落地任务。车牌检测 + 车牌识别其中“车牌识别”是核心难点之一,因为它要求:高精度字符识别强抗干扰能力(光照、模糊、遮挡)实时性(嵌入式部署)在这一背景下,LPRNet 被提出。LPRNet = 专门为车牌识别设计的轻量级端到端网络无需字符切割,直接进行端到端车牌识别的深度学习模型强调“轻量 + 实时”↓↓↓CTC Layer↓。
2026-06-12 09:09:21
142
原创 掌握生成对抗网络(GAN)原理——从零理解“对抗学习”的核心思想与生成机制
在深度学习的发展过程中,有一类模型改变了“数据只能被动学习”的传统认知,它就是:不仅能理解数据,还能“创造数据”例如:生成逼真的人脸生成艺术图像图像修复数据增强风格迁移深度学习中最“有创造力”的模型之一通过“生成器 + 判别器”相互博弈进行训练的生成模型“对抗式学习框架”z(随机噪声)↓↓Fake Data↓↓GAN是深度学习中极具代表性的生成模型,它通过生成器与判别器之间的对抗训练机制,实现了从“数据理解”到“数据创造”的跨越。本文系统讲解了:1、GAN基本概念。
2026-06-12 09:09:11
204
原创 掌握生成对抗网络(GAN)的优化目标与评估指标——从博弈函数到生成质量衡量体系
min-max博弈问题D:提升判别能力G:提升欺骗能力方法优化思想GANJS散度WGANWasserstein距离LSGAN最小二乘生成图像的清晰度 + 多样性GAN的核心不仅是生成能力,更重要的是其独特的优化目标与评估体系。本文系统讲解了:1、GAN优化目标(min-max博弈)2、生成器与判别器目标3、WGAN/LSGAN改进4、训练不稳定问题5、评估指标体系(IS/FID/KID/LPIPS)6、指标之间关系7、训练策略优化8、实际评估流程。
2026-06-12 09:09:01
209
原创 掌握条件生成对抗网络(Conditional GAN)模型结构——从无条件生成到可控生成的进阶
在GAN基础上引入“条件信息”的生成模型(z, y)↓↓G(z,y)↓↓Conditional GAN是在传统GAN基础上的重要扩展,它通过引入条件变量y,使生成过程变得“可控”,从而将生成模型从“随机创造”提升到“按需生成”。
2026-06-12 09:08:51
220
原创 掌握扩散模型原理——从噪声逐步生成到现代生成式AI的核心范式
在生成式模型的发展历程中,Denoising Diffusion Probabilistic Model的出现标志着生成方式的一次重要转变。通过对抗训练“逼近真实数据分布”通过“逐步去噪”还原真实数据它目前已经成为图像生成领域的主流方法之一,例如:DALL·E 2(部分模块)Imagen通过逐步向数据添加噪声,再学习反向去噪生成数据的概率生成模型Noise xT↓↓x_{t-1}↓...↓x0 (Image)学习“从噪声中逐步恢复数据分布”先破坏数据,再学会重建数据。
2026-06-12 09:08:39
200
原创 掌握稳定扩散模型(Stable Diffusion)原理——从扩散过程到潜空间生成的完整解析
在生成式AI领域,Stable Diffusion几乎已经成为“文生图”的代名词。不再直接在像素空间生成,而是在潜空间(Latent Space)生成这使得它具备:更快的生成速度更低的计算成本更高的可扩展性基于潜空间扩散模型的文本条件图像生成模型↓↓↓↓ImageStable Diffusion通过“潜空间扩散 + 文本条件控制 + U-Net去噪 + VAE解码”的组合,实现了高效且高质量的文本生成图像能力,是当前生成式AI最重要的基础模型之一。
2026-06-12 09:08:26
207
原创 掌握 ControlNet 原理——从扩散模型控制能力到结构化条件生成
生成结果“可控性不足”例如:无法精确控制人物姿态无法严格约束边缘结构无法稳定复现布局结构ControlNet在扩散模型中引入“结构化条件控制”的神经网络框架↓↑↓↓↓ControlNet通过在扩散模型中引入结构化条件控制分支,实现了从“文本驱动生成”到“结构可控生成”的重要升级,是当前AI绘图系统中最关键的控制增强模块之一。本文系统讲解了:1、ControlNet基本概念2、核心结构设计3、Stable Diffusion关系4、控制分支机制6、多种控制类型。
2026-06-11 08:36:12
71
原创 自然语言处理发展历史——从规则系统到大语言模型的演进之路
让机器理解、生成并处理人类语言但这个目标的实现经历了漫长演进,从早期的“规则驱动”,到统计模型,再到深度学习,最终进入今天的大模型时代。自然语言处理的发展经历了从规则系统到统计学习,再到深度学习,最终迈向大语言模型时代的完整演进过程,每一次技术跃迁都带来了能力的指数级提升。本文系统讲解了:1、NLP发展四大阶段2、规则时代特点3、统计学习方法4、深度学习突破5、Transformer革命6、大模型时代7、核心技术里程碑8、任务演变9、发展驱动力10、未来趋势。
2026-06-11 08:36:00
87
原创 自然语言处理常见任务——从文本理解到生成式AI的完整任务体系
Natural Language Processing的目标是让机器具备理解和生成语言的能力,而实现这一目标,需要拆解成多个具体任务。理解 → 分析 → 推理 → 生成随着Transformer和大语言模型的发展,这些任务也逐渐从“单点能力”演化为“统一建模”。将文本映射到预定义类别为文本中的每个词分配标签判断两个文本是否语义相关根据输入生成自然语言文本根据问题从文本中或知识中找答案将一种语言转换为另一种语言将长文本压缩为短文本提取关键句重新生成摘要预测下一个词或句子与人类进行多轮交互。
2026-06-11 08:35:24
82
原创 自然语言处理中的分词——从语言切分到模型输入的第一步
在Natural Language Processing中,几乎所有任务的第一步都是“分词(Tokenization)”。如何把连续的文本切成模型可以理解的最小单元?分词就是解决这个问题的关键技术。将连续文本拆分为有意义的最小语言单元(Token)以单个字符作为最小单位以“词”为单位切分文本介于字符和词之间的最优折中单位分词是自然语言处理的第一步,也是最基础但最关键的一步,它决定了模型如何“看到”语言。本文系统讲解了:1、分词基本概念2、字符级 / 词级 / 子词级3、BPE算法原理。
2026-06-11 08:35:14
191
原创 自然语言处理中的词嵌入——从离散符号到语义向量空间
如何让机器理解“词语的语义”词与词之间“没有任何语义关系”为了解决这个问题,词嵌入(Word Embedding)技术被提出。将词语映射到一个低维、稠密的向量空间Text↓↓↓↓词嵌入是自然语言处理中的基础技术,它将离散的语言符号转化为连续的向量空间,使机器能够理解语义关系,并为后续深度学习模型提供统一输入表示。本文系统讲解了:1、词嵌入基本概念2、与One-hot对比3、向量空间语义4、Word2Vec模型5、GloVe模型6、FastText模型7、训练方式。
2026-06-11 08:35:03
105
3
原创 循环神经网络及LSTM——从序列建模到长期依赖记忆机制
在深度学习处理序列数据的早期阶段,Recurrent Neural Network曾经是最核心的模型结构之一。它被广泛用于:语言模型机器翻译时间序列预测难以建模长距离依赖LSTM(长短期记忆网络)能够处理序列数据的神经网络结构RNN和LSTM是序列建模领域的经典模型,其中RNN奠定了序列学习基础,而LSTM通过引入门控机制解决了长期依赖问题。本文系统讲解了:1、RNN基本结构2、时间展开机制3、梯度问题4、LSTM提出背景5、三大门结构6、细胞状态机制。
2026-06-11 08:34:51
148
原创 NLP中的卷积神经网络CNN——从图像卷积到文本特征提取的跨界应用
在Natural Language Processing的发展过程中,卷积神经网络(CNN)不仅在计算机视觉中取得巨大成功,也被引入到文本建模任务中。局部特征提取 + 高效计算 + 并行能力强使用卷积神经网络对文本序列进行局部特征提取的模型连续N个词的组合↓Conv1D↓Activation↓Pooling↓↓Output卷积神经网络在NLP中的核心价值在于高效提取局部语义特征,尤其适用于文本分类与短文本理解任务。
2026-06-11 08:34:38
146
原创 Attention机制及Transformer——从注意力计算到现代大模型的核心架构
Transformer出现之前 vs Transformer之后Attention(注意力机制)它彻底改变了序列建模方式,并成为现代Transformer与大语言模型的基础。让模型在处理信息时“动态关注重要部分”的方法输入序列内部做Attention多个Attention并行学习不同语义子空间输入序列↓Q K V↓相似度计算↓权重分配↓加权输出↓↓↓Output。
2026-06-11 08:34:27
175
原创 膨胀卷积与命名实体识别——从感受野扩展到序列标注建模
在Natural Language Processing任务中,命名实体识别(NER)是一项非常基础但关键的任务,它的目标是从文本中识别出具有特定意义的实体,例如:人名地名组织机构时间表达与此同时,在深度学习结构设计中,Dilated Convolution提供了一种扩展感受野的高效方法。当这两者结合时,可以显著提升NER模型对上下文的建模能力。从文本中识别出具有特定语义类别的词或短语在卷积核中插入“间隔”的卷积方式Text↓Embedding↓↓↓↓Entities。
2026-06-11 08:34:16
171
原创 RLHF中的PPO算法——大语言模型对齐优化的核心引擎
在现代大语言模型训练体系中,Reinforcement Learning from Human Feedback已经成为“对齐人类偏好”的标准方法。SFT → Reward Model → PPO优化它决定了模型最终输出质量的上限。在不让策略变化太剧烈的前提下,持续提升收益A_t = 当前策略好坏程度SFT → 学能力RM → 学偏好PPO → 优化行为PPO是RLHF中实现模型对齐的核心优化算法,它通过“限制策略更新幅度 + 利用奖励模型反馈”实现稳定而高效的训练,使大语言模型能够逐步逼近人类偏好。
2026-06-11 08:33:45
223
原创 掌握多头自注意力机制(Multi-Head Self-Attention)——Transformer 强大表达能力的核心来源
Multi-Head Self-Attention(多头自注意力机制)是 Transformer 成功的关键技术之一,也是现代大语言模型最核心的基础组件。本文重点掌握了:1、多头自注意力提出背景;2、单头Attention存在的问题;3、多头机制核心思想;4、Q、K、V作用;5、多头Attention计算流程;6、Head拆分机制;7、Concat与线性映射过程;8、Transformer中的位置;9、PyTorch实现方式;10、多头自注意力优势与不足。
2026-06-10 09:20:11
82
5
原创 掌握 Self-Attention(自注意力)机制——Transformer 与大模型的核心基础
注意力机制关注重要信息忽略无关信息例如:小明喜欢打篮球。篮球时。小明喜欢而不会重点关注无关内容。这就是:注意力机制。自注意力机制所谓“自”。自己关注自己换句话说:输入序列中的每个元素。都会与序列中的所有元素建立联系。我 喜欢 深度 学习学习时。我喜欢深度学习并自动计算:谁对当前词更重要。Self-Attention 是 Transformer 架构的核心,也是现代人工智能最重要的基础技术之一。本文重点掌握了:1、什么是 Self-Attention;
2026-06-10 09:17:13
124
原创 掌握混合注意力 CBAM 与 BAM 模型结构——从通道注意力到空间注意力的融合实践
CNN 注意力机制的发展大致经历了三个阶段。SENet哪个通道重要图像哪个位置重要通道注意力空间注意力同时建模。BAMCBAM2018年。韩国 POSTECH 团队提出:BAM其核心思想:在网络 Bottleneck 位置插入注意力模块。增强关键特征表达能力。同样在2018年。韩国团队进一步提出:CBAM关注什么关注哪里本文重点掌握了:1、混合注意力机制的发展背景;2、BAM 模型结构;3、BAM 通道注意力模块;4、BAM 空间注意力模块;5、CBAM 模型结构;
2026-06-10 09:15:22
86
1
原创 掌握空间注意力 STN 模型结构——让神经网络学会自动“看准位置”
定位网络。作用:预测图像应该如何变换。变换参数 θ得到变换参数后。输出图像对应输入图像哪里这项工作由:Grid Generator 完成。Sampler:采样器。作用:根据 Grid Generator 计算出的坐标。从原图中取值。Spatial Transformer Network(STN)是深度学习视觉领域的重要里程碑模型,也是最经典的空间注意力机制之一。本文重点掌握了:1、STN 提出的背景;2、传统 CNN 的局限性;3、STN 核心思想;
2026-06-10 09:13:20
105
原创 掌握 SENet 模型结构——开启深度学习注意力机制时代的经典网络
即:宽度32高度32通道64Squeeze 的目标:将空间信息压缩。即:全局平均池化。SENet 是卷积神经网络发展史上的里程碑模型,也是深度学习注意力机制在视觉领域成功应用的重要开端。本文重点掌握了:1、SENet 提出的背景;2、传统 CNN 的局限性;3、SE Block 核心思想;4、Squeeze 操作原理;5、Excitation 操作原理;6、Scale 重标定机制;7、PyTorch 实现方式;8、SENet 的优势与不足;
2026-06-10 09:11:13
273
原创 掌握注意力模型基础和应用——从 Attention 机制到 Transformer 的核心原理
想象这样一个场景:你正在看一张班级合照。虽然照片中有几十个人,但你的目光会优先关注:自己熟悉的同学老师而不会平均关注每一个人。注意力机制即:对重要信息赋予更高权重,对次要信息降低关注度。Q、K、V 全部来自同一个输入。我喜欢深度学习我喜欢深度学习每个词都会:生成Q生成K生成V然后两两计算关系。Attention 机制是现代深度学习最重要的技术之一,也是 Transformer 和大语言模型成功的核心基础。本文重点掌握了:1、什么是 Attention;
2026-06-10 09:09:11
141
原创 掌握 MixNet 模型结构——混合卷积核如何提升轻量化网络性能
MixNet 最大的创新:简称:MixConv全部通道↓3×3卷积↓输出部分通道 → 3×3部分通道 → 5×5部分通道 → 7×7部分通道 → 9×9↓Concat↓输出即:不同通道使用不同大小的卷积核。SE 全称:作用:自动学习不同通道的重要程度。↓↓FC↓ReLU↓FC↓Sigmoid↓MixNet 是 Google 在轻量化神经网络领域的重要创新成果。
2026-06-10 09:07:01
138
原创 PyTorch 与它的自动微分工具:Autograd
Autograd自动微分系统如果没有 Autograd,我们在训练神经网络时,需要手工推导并编写大量梯度计算代码。线性层梯度卷积层梯度激活函数梯度损失函数梯度这些计算不仅复杂,而且容易出错。而 PyTorch 的 Autograd 系统能够自动构建计算图,并利用链式法则自动完成反向传播。前向传播梯度计算则交给框架完成。本文将深入理解:什么是 AutogradAutograd 的工作原理requires_grad 的作用grad 与 grad_fnbackward() 的执行过程。
2026-06-10 09:01:21
198
1
原创 链式法则如何传递参数误差 —— 深入理解神经网络中的梯度传播
反向传播的本质就是链式法则链式法则不是高中求导知识吗?为什么它能训练神经网络?为什么它能更新数百万参数?误差到底是如何传递到每一层的?事实上,神经网络训练的核心并不复杂。CNNRNNGPTDeepSeek链式法则(Chain Rule)本文将通过一个简单神经网络,深入理解:什么是误差传播链式法则如何工作为什么误差能够传递到每一个参数自动微分如何利用链式法则计算梯度如何知道每个参数应该往哪个方向调整?链式法则Loss↓输出层↓隐藏层↓输入层将误差逐层传播。每一个参数。
2026-06-10 09:01:11
276
原创 掌握 MobileNet V1 模型结构——轻量级卷积神经网络的开山之作
Depthwise Convolution 翻译为:深度卷积核心思想:每个输入通道独立卷积。例如:3个卷积核3 × 3 × 1分别处理:R通道G通道B通道1×1卷积虽然卷积核尺寸很小。但作用非常重要。MobileNet V1 是轻量化卷积神经网络发展史上的重要里程碑。
2026-06-10 09:00:54
329
1
原创 将手写自动微分应用到神经网络训练
通过本篇文章,我们完成了以下任务:将手写的模块应用到神经网络训练实现前向传播 + 反向传播完整流程使用全连接层 + ReLU构建简单神经网络实现参数更新,并进行训练验证手写梯度的正确性核心思路:自动微分模块只需要实现forward()和backward()每层记录中间结果用于链式法则计算梯度训练循环:前向 → 损失 → 反向 → 参数更新通过这种方式,你可以理解 PyTorch / TensorFlow 内部梯度计算的原理,并在没有框架的情况下训练一个神经网络,为深入学习。
2026-06-09 09:42:11
6692
1
原创 代码实现 Softmax + 交叉熵的自动微分
Softmax将 logits 转为概率交叉熵衡量预测与真实分布差异梯度公式简单自动微分可轻松实现反向传播数值稳定性需注意:减去最大值,避免 log(0)通过手写实现,你可以更清楚地理解:前向传播:计算 Softmax 概率 + 交叉熵损失反向传播:利用链式法则计算 logits 的梯度这也是深度学习框架内部Autograd 机制的核心思想。掌握了 Softmax + 交叉熵的自动微分,你就能够自己实现神经网络训练的基础梯度更新逻辑,为理解更复杂的模型打下坚实基础。
2026-06-09 09:40:54
6743
原创 自动微分的原理:计算图与前向传播
假设有一个函数:dy/dx传统方法有两种。数据流图数据如何流动运算如何执行对应计算图:输入变量运算节点输出结果之间的关系。每一个Tensor每一次运算都会形成这样的图结构。自动微分是现代深度学习框架最重要的基础技术之一。复杂函数↓拆解成简单运算↓构建计算图↓执行前向传播↓保存中间结果↓后续计算梯度计算图负责记录计算过程前向传播负责计算最终结果二者共同构成了自动微分系统的基础。理解了计算图和前向传播之后,我们就已经掌握了自动微分的第一块拼图。
2026-06-09 09:37:56
6753
原创 实现 LLMOps 项目统计可视化 API 接口设计
在企业级 LLMOps 平台中,统计与可视化系统的重要性丝毫不亚于模型能力本身。用户统计会话统计模型统计Token统计成本统计Agent统计趋势分析单一职责模块化设计聚合查询缓存优化通过合理的 API 设计与统计架构,我们不仅能够了解 AI 系统的运行状态,还能为模型优化、成本控制以及业务决策提供可靠的数据支撑。对于一个真正落地生产环境的 LLMOps 平台来说,统计中心并不是附加功能,而是核心能力之一。
2026-06-09 09:34:55
6977
1
原创 统一管理多个 LLM 模型,并实现使用 YAML + Python 动态导入进行模型配置
随着企业 AI 系统不断发展,单模型架构已经逐渐无法满足需求。YAML配置中心动态导入模型工厂模型注册中心模型路由的设计模式。配置驱动代替代码驱动多模型管理动态扩展统一调用模型路由配置热更新对于 LLMOps 平台、Agent 平台以及企业级 AI 中台而言,这种架构已经逐渐成为主流实践。掌握 YAML + Python 动态导入的设计思路,也将为后续构建更复杂的 AI 系统打下坚实基础。
2026-06-09 09:29:55
6840
原创 了解 LangChain 中的 LLM 与 ChatModel 的差异
LLMChatModel很多初学者容易混淆它们的概念、作用和使用场景。本文将通过对比与代码示例,帮助你彻底理解它们的差异,并掌握在实际开发中如何选择。LLM:通用文本生成,适合单轮任务,输入输出简单,灵活性高。ChatModel:对话专用,支持多角色消息和上下文,适合多轮场景,尤其在 Agent 或 Workflow 中不可或缺。迁移策略:单轮保留 LLM,多轮迁移 ChatModel;Prompt 可以通过 HumanMessage 封装轻松迁移。正确理解两者差异,有助于:提高开发效率。
2026-06-09 09:26:49
6841
原创 掌握工作流自适应排版与 Dagre 功能,实现一键排版工作流
随着 AI Agent 和 Workflow 的快速发展,越来越多的系统开始采用可视化工作流设计模式。例如:Coze 工作流FlowiseFastGPTReact Flow 自定义工作流平台开始节点↓知识库检索↓Agent分析↓工具调用↓结果输出当流程简单时没有问题。10个节点20个节点50个节点100个节点连线交叉节点重叠布局混乱难以阅读这时就需要:自动布局(Auto Layout)而目前前端工作流领域最流行的自动布局方案之一,就是 Dagre。
2026-06-09 09:24:35
191
原创 掌握在 LangChain 中将 Agent 转换成 Workflow 的技巧
提前设计好的执行流程用户提问↓查询订单↓查询物流↓整理结果↓返回用户这里没有自主决策。而是固定执行。对应架构如下:相比 Agent:Workflow 的优点非常明显。状态负责在节点之间传递数据。"订单已支付""运输中"在 LangChain 早期,很多开发者喜欢使用 Agent 解决所有问题。Agent ≠ 最优解WorkflowAgent的组合架构。Workflow负责可控流程Agent负责智能决策。
2026-06-09 09:21:22
208
原创 学习 LLMOps:多应用场景下的大模型架构与设计思路
随着 ChatGPT、DeepSeek、Claude、Gemini 等大语言模型(LLM)的快速发展,越来越多企业开始将 AI 技术引入业务系统。messages=[{"role": "user", "content": "你好"}事实上,真正的企业级 AI 应用远远不只是一次模型调用。当系统进入生产环境后,还需要考虑:多模型管理Prompt 管理向量知识库Agent 工作流日志监控模型评估成本控制权限管理这些能力共同组成了如今热门的概念:大模型领域的 DevOps。
2026-06-09 09:16:06
682
原创 LangChain 0.x 到 1.x 的演进:从 Chain 时代迈向 Agent 时代
如果你在 2023 年接触过大模型应用开发,那么大概率听说过 LangChain。作为 LLM(Large Language Model,大语言模型)生态中最受欢迎的开发框架之一,LangChain 曾经是无数 AI 应用、知识库问答、智能客服以及 Agent 系统的首选框架。然而,随着 GPT、Claude、Gemini 等大模型能力的快速提升,以及 Agent 技术的兴起,LangChain 官方也逐渐意识到:单纯依靠 Chain(链式调用)已经无法满足复杂 AI 应用的需求。
2026-06-09 09:08:37
655
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅