langchain 30天学习计划
文章平均质量分 94
我是秦纪伟
hello
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
别再被SOTA忽悠了:一个工业级RAG测试集的「反人性」构建指南
摘要:Embedding模型选型是构建RAG系统的关键步骤,需重点关注权威基准MTEB榜单,从语言能力、任务需求、上下文长度、向量维度和系统成本五个维度筛选模型。建议采用AB测试方法验证模型在实际业务中的表现,同时根据数据规模选择合适的向量数据库存储方案。构建多维度测试集时,应采用分桶采样策略,覆盖基础任务、易混淆案例和复杂语义场景,重点关注硬负例识别能力。测试集的价值在于揭示模型能力边界,为系统优化提供方向。原创 2026-02-24 21:23:58 · 705 阅读 · 0 评论 -
Day 7:切割器
在RAG(检索增强生成)链路中,"切分(Chunking)"的质量直接决定了检索的精度。如果切分得太碎,会丢失上下文;如果切分得太粗,则会引入噪音并挤占大模型的上下文窗口,从切割方式和检索精度的角度来看,LangChain的切割器主要分为四大类,且业内主流方案正从"物理计数"向"语义感悟"演进。原创 2026-01-19 23:11:32 · 956 阅读 · 0 评论 -
LangChain V1.0 30日学习计划 --- Day 5:工具体系
本文介绍了LangChain中的工具体系及其应用。工具被定义为Agent的超能力插槽,具有明确的输入输出格式和文档描述,可通过LCEL插入链路。文章从原理和工程需求两方面阐述了LLM需要工具的原因:解决幻觉、实时信息获取等问题,同时满足可控性、安全性等工业需求。工具构建方式包括@Tool装饰器、StructuredTool和Runnable,其中@Tool是最简单的实现形式,能自动生成输入schema和参数解析。文章详细说明了工具与模型绑定的完整生命周期,包括准备、思考、生成指令、执行和观察回填等步骤。通过原创 2025-11-23 18:36:03 · 1659 阅读 · 0 评论
分享