自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

kaggle expert,全球排名前1000,清华计算机研究生,兴趣算法工程

kaggle expert,全球排名前1000,清华计算机研究生,兴趣算法工程

  • 博客(1469)
  • 资源 (4)
  • 收藏
  • 关注

原创 必知必会!常用矩阵求导和重要的矩阵

转自https://blog.csdn.net/a841454735/article/details/88608682,来备份一下,矩阵求导很重要!一、矩阵求导  一般来讲,我们约定,这是分母布局。常见的矩阵求导方式有:向量对向量求导,标量对向量求导,向量对标量求导。1、向量对向量求导2、标量对向量求导3、向量对标量求导其他的可以参考wiki:维基百科矩阵求导公...

2020-04-25 22:18:20 1967

原创 程序员面试——C++工程师面试大全第一部分

1.static 关键字的作用1. 全局静态变量在全局变量前加上关键字 static,全局变量就定义成一个全局静态变量.静态存储区,在整个程序运行期间一直存在.初始化:未经初始化的全局静态变量会被自动初始化为 0(自动对象的值是任意的,除非他 被显式初始化);作用域:全局静态变量在声明他的文件之外是不可见的,准确地说是从定义之处开始,到文件结尾.2. 局部静态变量在局部...

2020-02-24 13:41:40 719

原创 agent面试必备15-AutoGen 与 CrewAI 等多 Agent 框架详解

这篇文章深入浅出地讲解了多智能体协作框架(Multi-Agent Systems)的核心概念与应用。主要内容包括: 多Agent框架本质:将复杂任务分配给不同专业角色协作完成,对比了AutoGen(灵活对话编排)和CrewAI(结构化流水线)的特点。 设计理念:分权降低认知负载、对抗互补提升质量、可组合性实现灵活编排。 关键要素:角色定义(Prompt+工具+目标)、沟通方式(一对一/群聊/分层)。 适用场景:内容生产流水线、软件工程闭环等需要强分工的复杂任务。 面试要点:分析多Agent的优缺点、控制成本

2026-06-26 00:05:06 623

原创 agent面试必备16-模块综合:15+ 道高频面试题速查

并将这种“经验总结”跨轮次复用。

2026-06-26 00:05:05 29

原创 agent面试必备13-LangChain Agent 实现

本文解析了LangChain Agent的核心实现原理,从基础概念到面试常见问题。主要内容包括: LangChain Agent本质是一个"胶水"框架,将大模型、工具、记忆等组件整合成可运行程序,包含Agent(决策策略)和AgentExecutor(执行引擎)两大核心部分。 四大核心抽象层级:工具(Tools)、大模型(LLM/ChatModel)、推理策略(Agent)和代理执行器(AgentExecutor)。 AgentExecutor的工作流详解:接收输入→循环执行(计划→判断退出→执行工具→回填

2026-06-25 22:50:31 348

原创 agent面试必备14-LangGraph 状态机

在真实的复杂业务场景中,流程很少是一条直线,更像是一张流程图(Graph)。节点 (Node):图中的圆圈。代表具体的处理步骤,比如“调用大模型”、“执行 Python 代码”、“发邮件”或者“等待人工点击同意”。边 (Edge):连接圆圈的箭头。代表流转关系,决定了做完这一步,下一步该去哪。LangGraph 的核心思想:所有的节点共享一份“全局档案(State)”。每个节点拿到这份档案,做点自己的工作,把结果更新到档案里,然后顺着“边”把档案传递给下一个节点。

2026-06-25 22:50:25 253

原创 agent面试必备11-Reflexion 框架

做完不等于结束——还要评估做得好不好,把教训记下来,下次带着教训重试。你可以把它想象成我们在学校里的**“写错题本”以前的大模型做错题,你让它重试,它可能还会犯同样的错误(盲目刷题)。而 Reflexion 要求模型在失败后,不仅要知道自己错了,还要用自然语言写下一条具体的反思(Reflection)**:“哦,我刚才没有先确认单位换算,下次我应该先统一把美元换算成人民币”。然后,带着这个反思记录,重新去做这道题。Reflexion 强调的是语言化的反思。

2026-06-23 00:21:13 301

原创 agent面试必备12-LATS(Language Agent Tree Search)

我们可以把 Agent 解决复杂问题想象成走迷宫。ReAct:走到一个路口,大模型随便看一眼,选一条路直接走下去。如果走进了死胡同,任务就失败了。LATS:走到一个路口,大模型不急着走。它会把这里的每一个岔路口都当作树的一个“分支”,先派几个“侦察兵”去探探路(模拟预测),给每条路打个分。哪条路得分高,就走哪条。如果后来发现不对劲,还可以退回到得分第二高的路口重新选。LATS 将大语言模型(LLM)与经典的蒙特卡洛树搜索(MCTS, Monte Carlo Tree Search)思想结合在了一起。

2026-06-23 00:21:03 550

原创 agent面试必备10-AI Agent 核心框架大揭秘:Plan-and-Execute

先制定全局计划(Planner),再按部就班地执行(Executor)。ReAct(推理+行动)就像是**“走一步看一步”**:走到路口看看路牌,再决定往左拐还是往右拐。适合环境变化快、需要频繁试错的场景。就像是**“出门前先做好攻略”:去旅行前,先列好详细的行程单(第一天去哪、第二天去哪)。然后再按天去玩。如果在执行过程中发现“景点关门了”,那就触发“重新规划(Re-planning)”**,修改后面的行程。Plan-and-Execute 先画出一张「总蓝图」,然后再落地。

2026-06-22 15:45:20 365

原创 agent面试必备9-AI Agent 核心框架大揭秘

📝 ReAct框架:AI Agent的核心推理与行动机制 摘要:ReAct(推理+行动)是当前AI Agent开发的主流框架,通过将思考过程与工具使用结合,使大模型的推理更可靠。其核心流程包括:思考(Thought)→行动(Action)→观察(Observation)的循环,直到得出最终答案。文章详细解析了ReAct的工作原理、Prompt模板设计、代码实现关键点,并提供了面试常见问题的标准答案。ReAct的优势在于可解释性强、结果可靠,但也存在成本高、格式依赖性强等缺点,特别适用于需要频繁与外部工具交

2026-06-22 15:45:17 472

原创 agent面试必备8-AI Agent 综合面试题库1

LLM Agent 是以大语言模型为推理核心,在。

2026-06-21 18:24:04 449

原创 agent面试必备7-AI Agent 在真实落地中的 5 大挑战与局限

Agent 的初衷是赋予大模型更多自主权,让它变强。“Agent 把能力做强的同时,也会把错误放大到多步!如果模型在第一步做了一个错误的假设,后续的每一步都会错上加错(这叫做错误级联)。“限步、限权、可观测、可回滚”。

2026-06-21 18:24:03 446

原创 agent面试必备6- AI Agent 能干啥?5 大经典应用场景与落地指南

AI Agent 五大落地场景与实施要点 本文总结了 AI Agent 在企业中的五大典型应用场景及工程实现关键:智能客服(需身份鉴权与防幻觉)、代码助手(沙箱环境与权限控制)、数据分析(SQL安全执行与权限管理)、自动化运维(高危操作审批机制)和知识管理(文档溯源与版本控制)。核心落地原则包括高频、可工具化和可评估,并强调安全性(权限隔离)、可控性(人工干预)和可观测性(全链路监控)。文末以数据分析场景为例,展示如何通过Prompt约束+正则校验+只读账号实现SQL安全执行,解决面试常见问题。

2026-06-19 00:12:27 353

原创 agent面试必备5-深入理解 AI Agent:5 大经典分类

本文介绍了人工智能领域中Agent的五大经典分类及其在实际应用中的体现。1) 反应式Agent:基于简单条件反射,响应快但缺乏灵活性;2) 基于模型Agent:维护世界模型进行预判;3) 基于目标Agent:以目标为导向进行路径规划;4) 基于效用Agent:综合考虑多因素做出最优选择;5) 学习型Agent:通过反馈持续优化。文章还分析了这些理论在现代LLM Agent中的映射,指出实际系统多为混合架构。最后通过Python代码对比了反应式和效用型Agent的实现差异,并提供了面试常见问题的标准答案,帮助

2026-06-19 00:12:23 319

原创 大模型面试必备17-重要性采样

猫喜欢鱼”。t1t_1=t1​“猫”、t2t_2=t2​“喜欢”、t3t_3=t3​“鱼”。这是我们最终想要训练出的聪明模型。这是我们在训练过程中用来生成采样数据(也就是过去收集到的经验数据)的旧模型。动作 (Token)目标策略 P 的概率 (聪明)行为策略 Q 的概率 (笨)t1 = “猫”(句首)0.80.5t2 = “喜欢”(接在"猫"后)0.70.2t3 = “鱼”(接在"猫喜欢"后)0.90.3在数学上,重要性采样是在无法直接从目标分布P。

2026-06-18 22:42:08 502

原创 大模型面试必备16- GRPO 到底比 PPO 强在哪

摘要: DeepSeek提出的GRPO算法相比PPO在强化学习对齐(RLHF)中具有显著优势。PPO需同时维护4个模型(策略、参考、奖励、价值模型),显存和算力消耗大;而GRPO通过“组内竞争”机制简化流程:对同一输入生成多个回答,用Reward模型直接打分后计算组内均值与标准差,以相对优势(标准化分数)替代PPO的Critic模型预测。这一改进节省了显存(无需Critic模型),并通过群体统计量提升训练稳定性和模型综合表现。核心优势在于以空间换架构精简,实现高效低成本训练。

2026-06-18 22:42:05 482

原创 大模型面试必备15- GRPO 利用的数据是旧策略产生,为什么叫 on policy

在准备大模型算法岗面试时,如果你在简历里写了了解 PPO 或 GRPO 算法,面试官极有可能会抛出一个看似矛盾的“陷阱题”:“既然 PPO/GRPO 在计算损失时,用到了旧策略(old policy)产生的数据,那它不就是 Off-policy(离线策略)了吗?为什么大家都说它是 On-policy(在线策略)呢?如果不理解底层逻辑,这个问题很容易让人翻车。

2026-06-18 00:06:59 478

原创 大模型面试必备14-bert

本文拆解了BERT模型的核心工作流程,将其单层结构归纳为5个关键步骤: Embedding层:融合词向量、句向量和位置向量; 多头自注意力机制:通过QKV矩阵计算全局上下文关系; 残差连接与层归一化:稳定梯度并保留原始信息; 前馈神经网络:增强非线性表达能力; 二次残差与归一化:为下一层输出优化特征分布。 全文以面试场景为导向,突出“5步拆解法”,帮助读者快速掌握BERT的Encoder核心机制,特别强调自注意力公式中的缩放因子(√dk)和残差连接的作用,适合作为面试速记要点。

2026-06-17 22:53:08 319

原创 大模型手撕代码1- 手撕 MoE路由优化算法

本文介绍了一种针对设备限制的MoE(混合专家模型)路由优化算法,旨在减少大模型训练中的跨卡通信开销。算法核心思想是将专家分组到不同NPU设备上,通过选择概率最大的P个组(而非所有组),再从中筛选Top-K专家,从而限制通信范围。文章提供了清晰的四步解题思路(分组、选组、聚合、决胜)和完整Python实现代码,并强调面试中需结合系统设计理念(如辅助损失、容量约束)进行阐述。该题目考察了数组操作、排序算法和大模型分布式训练优化的综合能力。

2026-06-17 22:53:05 206

原创 大模型面试必备13-Softmax 前为什么要除以根号 d?

在深度学习和大模型的面试中,Transformer 架构的细节是绝对的必考区。其中,关于自注意力机制(Self-Attention)经常有一个极为经典的连环问:它的核心公式如下 :Attention Scores=Softmax(QKTdk)\text{Attention Scores} = \text{Softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)Attention Scores=Softmax(dk​​QKT​)今天,我们就来彻底拆解这道硬核面试题。首先,我们要

2026-06-16 22:17:55 761

原创 大模型面试必备12-熵坍塌现象?如何解决熵坍塌?

简单来说,熵坍塌是指在大模型强化学习的早期,策略熵(Entropy)急剧下降的现象。熵的下降意味着模型变得过度自信,采样输出的回答几乎相同,这严重限制了模型的探索空间与推理能力。熵迅速下降了 73%,同时模型性能提升了 76%。熵下降了 94%,模型性能提升了 93%。熵仅仅下降了 6%,模型性能也只获得了微不足道的 7% 的提升。超过 95% 的熵消耗和性能增益都发生在训练的“极早期”阶段。模型在少量步数内就匆匆决定了最终性能,导致后续漫长的训练沦为无效的算力消耗。

2026-06-16 00:36:02 401

原创 大模型面试必备10-BatchNorm 与 LayerNorm 、张量并行

摘要: 深度学习模型中,NLP领域普遍使用LayerNorm(LN)而非BatchNorm(BN),主要因两点: PAD干扰:BN跨样本计算时,填充符(PAD)会污染真实Token的统计分布; 语义一致性:BN受同Batch其他句子影响,破坏Token的上下文相关语义。而LN独立处理每个Token的特征维度,免疫变长序列问题,更适合NLP任务。 张量并行(TP)中的“先列后行”切分策略: 在Transformer的MLP层中,为避免非线性激活函数(如GeLU)引入额外通信: 第一层列切:使局部结果可独立激活

2026-06-15 22:00:22 398

原创 大模型面试必备11-InfoNCE loss 和 Cross Entropy Loss

任务明确,分类数量有限(比如判断图片是猫、狗、还是猪),且有充足的人工标注数据。面临大规模预训练、图文匹配(CLIP)、推荐系统或自监督学习时。因为在这些场景下,“每个物品/人物/Token 本身就是一个独立的类别”,类别数接近无限,这时候“找不同”比“做单选”高效得多。“Cross Entropy 侧重于通过全类别遍历让特征极化对齐,强依赖人工标签;

2026-06-15 22:00:19 342

原创 大模型面试必备8-模型并行、显存计算

本文系统讲解了大模型分布式训练中的核心通信原语及其应用场景。首先介绍了五大通信原语:Broadcast(广播初始化参数)、Scatter(数据分片)、Gather(结果收集)、Reduce(梯度聚合)和AllReduce(同步更新),通过员工协作的比喻形象说明其区别。特别强调AllReduce=Reduce+Broadcast,是分布式训练梯度同步的关键。其次详细推导了大模型显存估算方法:全精度下1B参数约需4GB显存,并给出不同量化级别的显存对照表。最后指出实际推理还需考虑激活值、KV缓存等额外开销,建议

2026-06-14 09:50:54 306

原创 大模型面试必备9-大模型badcase、Encoder-Only 和 Decoder-Only

对比维度Encoder-Only (如 BERT)Decoder-Only (如 GPT, LLaMA)注意力机制双向 (Bidirectional):可以看到完整的上下文。单向 (Unidirectional/Causal):只能看到当前词及其前面的词。训练方式完形填空 (Masked Language Modeling)预测下一个词 (Next Token Prediction / Autoregressive)执行效率(预测时)快:并行计算,一次运行输出全部结果。慢:串行计算,生成NNN。

2026-06-14 09:50:39 341

原创 大模型面试必备7-left padding、MoE 网络、Router

本文讨论了大语言模型(LLM)中Left Padding的应用原因以及MoE架构的核心原理。 Left Padding的转变:从BERT时代的Right Padding转向LLM的Left Padding,主要因为Decoder架构需要确保生成的连贯性。Left Padding使真实Token末尾对齐,避免语义断层,在批量处理时更高效。 MoE架构解析: MoE通过稀疏激活专家网络(如FFN层)取代传统稠密模型,提升参数容量而不显著增加计算量。 路由器(Router)基于Softmax分配输入Token给特

2026-06-13 15:56:36 256

原创 大模型面试必备6-看懂 PPO、DPO、GRPO、DAPO 与 GSPO

大模型对齐算法演进:从PPO到GSPO 大模型对齐技术通过RLHF使模型响应更符合人类偏好。PPO作为鼻祖,使用4个模型(策略、参考、奖励、价值模型)计算优势值优化策略,但训练复杂。DPO简化流程,直接利用偏好数据微调,省去奖励模型。GRPO改进PPO,通过组内采样计算相对优势,提升推理能力。DAPO针对GRPO优化,引入动态采样、软惩罚等机制,解决长文本训练问题。GSPO则针对MoE架构,采用整句优化避免词级噪声,提升稳定性。各算法核心差异如下: PPO:多模型协作,Clip限制更新; DPO:直接偏好优

2026-06-13 15:56:08 393

原创 大模型面试必备4-熵、交叉熵和 KL 散度、拒绝采样

摘要 本文从信息论基础概念出发,系统阐述了熵、交叉熵与KL散度的理论关系及其在机器学习中的应用逻辑: 信息熵作为不确定性度量,量化系统的平均信息量;KL散度衡量两个概率分布的差异,具有非负性和非对称性;交叉熵则作为连接桥梁,其最小化等价于最小化KL散度,成为分类任务的核心损失函数。 在拒绝采样部分,对比了统计学与大模型应用的差异:统计学中是通过辅助分布逼近目标分布,而大模型训练中则是利用奖励模型筛选高质量样本,通过"生成-评分-筛选"机制提升监督微调数据质量,但需注意奖励模型偏差带来的风险。 全文揭示了这些

2026-06-13 10:58:21 748

原创 大模型面试必备5-困惑度、数据在 GPU 上到底是怎么流转的

摘要 语言模型评估指标困惑度(Perplexity) 困惑度(PPL)是衡量语言模型预测能力的核心指标,表示模型预测下一个词时的平均不确定程度。其计算基于条件概率的乘积,通过取对数避免数值下溢,最终取指数得到PPL值。PPL越低,模型预测越准确。公式为:$PPL = \exp(-\frac{1}{N}\sum \log P(w_i|w_{<i}))$。面试中需强调其与交叉熵的关系($PPL = e^{CrossEntropy}$)及工程实现细节。 GPU数据流转原理 GPU计算涉及三级存储: DRAM(系统

2026-06-13 10:57:46 304

原创 大模型面试必备3-深度思考自主切换、Muon 优化器与Adam

文章摘要: 本文探讨了大模型深度思考(CoT)的自主切换技术(AutoThink)与新型优化器Muon。针对CoT的“过度思考”问题,提出三类解决方案:基于规则(熵值/概率差值)、分类模型及多阶段强化学习(AutoThink),后者通过奖励机制动态平衡思考与效率。Muon优化器则通过正交化梯度动量,减少显存占用(仅为AdamW一半)并加速收敛,尤其适合分布式训练。两项技术分别提升模型推理效率与训练性能,推动AI向更高效、类人认知方向发展。 (字数:150)

2026-06-12 19:39:21 495

原创 大模型面试必备2- Bert 与 LSTM、MoE 架构与 Dense 架构

本文对比分析了NLP领域两大里程碑模型LSTM和BERT的核心差异。LSTM作为时序模型,通过门控机制实现序列记忆,但存在串行计算和长程依赖问题;而BERT基于Transformer编码器,利用自注意力机制实现并行全局语义理解。关键区别在于:1)LSTM适合序列生成任务,BERT擅长语义理解;2)BERT支持并行计算和预训练范式,显著提升效率与泛化能力。文章还深入解析了混合专家模型(MoE)架构,说明其通过稀疏激活和专家分工实现参数高效扩展,同时指出负载均衡等挑战。整体呈现了NLP从序列建模到语义理解的演进

2026-06-12 19:37:49 655

原创 大模型入门-大模型优化方法14- DeepSeek-V3.2 :DeepSeek Sparse Attention 详解

DeepSeek推出DeepSeek Sparse Attention (DSA),通过稀疏注意力机制优化长文本处理效率。核心包括闪电索引器(轻量级FP8加速相关性计算)和细粒度Token选择(仅处理Top-k关键Token),显著降低计算复杂度(从$O(L^2)$降至$O(Lk)$)。训练分两步:先密集热身优化索引器,再稀疏训练适配全模型。实测在128K上下文中,推理成本预填充阶段降低50%-67%,解码阶段减少80%以上,性能无损甚至部分任务超越基线。DSA以“精准筛选”替代传统全注意力,为长文本场景提

2026-06-11 16:38:58 402

原创 大模型面试必备1- BM25和 TF-IDF

本文系统介绍了信息检索算法从TF-IDF到BM25的演进历程。TF-IDF通过词频(TF)和逆文档频率(IDF)的乘积衡量文档相关性,但其存在词频线性增长、文档长度偏差和缺乏调参空间三大缺陷。BM25针对这些问题进行了优化:引入k1参数实现词频的非线性饱和,通过b参数进行文档长度归一化处理,有效抑制了高频词堆砌和长文档优势。实战对比显示,BM25能更准确地识别文档相关性,避免TF-IDF的评分偏差。文章建议在实际应用中优先选择BM25,并提供了面试应答的核心要点,强调BM25是对TF-IDF的工程化改进。

2026-06-11 16:38:42 508

原创 大模型入门-大模型优化方法12-YaRN 长文本外推技术

YaRN是一种突破性的大语言模型长文本处理技术,通过创新的"高频外推+低频内插"策略解决了传统位置编码的长度限制问题。该技术将RoPE位置编码的不同频率分量进行分层处理:对高频信息保留精细位置关系,对低频分量采用压缩内插,同时完全保留极端低频分量。相比完全重新训练,YaRN只需少量微调即可实现数倍长度扩展,既保持了绝对位置的确定性,又具备相对位置的灵活性。这种智能的频率分配方案有效避免了位置信息漂移,成为当前处理超长文本最高效的解决方案之一,为LLM的实际应用扫清了关键障碍。

2026-06-08 22:09:15 384

原创 大模型入门-大模型优化方法13- MTP 多 token 输出、DCA 双块注意力

摘要: DeepSeek-V3 引入两大核心技术突破:MTP(多 Token 预测) 和 DCA(双块注意力),显著提升模型效率与长文本处理能力。 MTP:打破传统单 Token 预测模式,通过并行预测未来多个 Token 并验证,实现推理加速(理论提速近1倍)。其训练时强制模型学习长程依赖,推理时通过自投机解码(Self-Speculative Decoding)三步走(预测→验证→采纳)高效生成文本。 DCA:解决长文本外推难题,无需微调即可扩展上下文窗口。通过分块策略(块内、块间、相邻块注意力)和位置

2026-06-08 22:09:13 445

原创 agent面试必备4-AI Agent 是如何工作的?揭秘 5 步核心工作流程

本文拆解了AI Agent的5步核心工作流程:1)输入处理(意图识别、安全过滤);2)任务分解(生成子任务列表);3)工具调用(执行具体操作);4)结果整合(处理数据冲突);5)输出生成(生成最终答案)。文章通过职场助手隐喻帮助理解,并提供了技术实现细节,包括结构化状态管理代码示例。针对面试常见问题,给出了防止Agent迷失的解决方案(如设置停止条件、维护任务清单)和处理数据冲突的方法(优先级规则、模型自主判断)。最后展示了用Python字典跟踪Agent状态的实践方案,强调结构化数据比简单对话记录更可靠。

2026-06-07 01:16:58 808

原创 大模型入门-大模型优化方法10-DeepSeek MLA

摘要:DeepSeek 提出的 MLA(多头潜在注意力)通过“低秩联合压缩技术”显著降低大模型推理时的显存占用。与传统方法不同,MLA 将高维 Key 和 Value 矩阵压缩为低维隐变量(Latent),仅在需要时解压还原,既保持了模型表现力,又将显存需求降低约 12.5 倍。其核心包括 Query 和 Key/Value 的降维-升维流程,以及 RoPE 位置编码的分离处理,最终通过拼接完成高效注意力计算。该方法在 DeepSeek-V2/V3 中实现“又快又省又强”的效果,代码实现通过线性投影层实现压

2026-06-07 00:23:57 327

原创 agent面试必备2- 搞懂 AI Agent:与 ChatBot、LLM Chain 的本质区别

文章摘要: 本文深入解析了AI领域三大核心概念——ChatBot、LLM Chain与AI Agent的本质区别。通过公司场景类比(前台接待、流水线工人、项目经理)形象化阐述三者的工作模式:ChatBot侧重线性对话,LLM Chain执行固定流程,而AI Agent能自主决策并动态调整行动路径。技术对比表从控制流、工具使用等维度揭示差异,强调Agent的核心在于模型驱动的闭环决策能力。文中提供架构图示、面试应答模板及伪代码示例,直观展示Chain(代码控制流程)与Agent(模型自主循环)的底层逻辑差异,

2026-06-07 00:10:52 529

原创 agent面试必备3-拆解 AI Agent:它的核心组成到底有哪些

如果你已经了解了 AI Agent 是什么,那么接下来面试官最爱考的,就是它的。一个完整的 AI Agent 就像是一个高度自动化的“数字员工”,为了能独立完成复杂任务,它必须具备一套完整的“器官”。今天我们来把 Agent 拆开揉碎,看看它到底是由哪几个核心部件组成的!

2026-06-07 00:10:51 328

原创 agent面试必备1-到底什么是 AI Agent?

本文是一篇AI Agent的入门指南,主要面向AI/算法面试准备者和大模型应用开发者。文章用通俗语言解释了AI Agent的概念,将其比作具备"大脑+手脚+记忆"的数字员工,并给出业界经典公式:Agent = LLM + Planning + Memory + Tools。重点解析了Agent的工作原理(ReAct范式)和与普通大模型调用的区别,强调其闭环决策能力。文章还提供了高频面试Q&A和Python伪代码示例,展示了一个极简的"思考-行动-观察"Agent循环实现,包括核心组件和面试加分要点,帮助读者

2026-06-06 20:39:45 520

Spark入门.docx

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

2020-04-02

人手一份核武器 - Hacking Team 泄露(开源)资料导览手册 _ WooYun知识库.pdf

事先声明本人并不是全栈安全工程师,仅仅是移动安全小菜一枚,所以对泄漏资料的分析难免会有疏忽或着错误,望各位围观的大侠手下留情。 首先来看安全界两大元老对Hacking Team(以下简称HT)被黑这个事件的看法: @tombkeeper: Stuxnet 让公众知道:“原来真有这种事”,Snowden 让公众知道:“原来这种事这么多”,Hacking Team 让公众知道:“原来这种事都正经当买卖干了”

2020-03-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除