自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 【Codex 接入国产模型API】的常见报错解决方案+codex插件接入VSCode集成指南

在使用接入国产模型时,需要手动配置文件,配置完成还会出现各种报错提示,经常会遇到流断开、404/401接口报错、Windows证书异常等问题。本文整理了高频报错的核心原因+一站式解决方案,内容亲测有效,直接照着操作即可解决问题。

2026-04-15 01:02:25 16512 1

原创 AI时代选择更合适架构选型

从零构建AI应用,优先选择AI原生架构,从底层规避后续重构成本;基于企业知识库做智能问答/客服,优先选择RAG专属架构,低成本快速落地;处理复杂自动化任务、多角色协同工作,优先选择Agent/Multi-Agent架构;规模化部署AI服务、管理大规模算力,优先选择云原生AI融合架构;实时数据流处理、低延迟AI决策,优先选择事件驱动+流处理AI架构。

2026-03-30 23:42:25 405

原创 RAG(检索增强生成)局限性的全面解析

摘要:RAG技术面临检索、推理、生成、工程和应用适配五大核心局限。检索环节存在数据预处理、召回排序和知识库维护难题;上下文窗口限制导致复杂推理能力不足;生成阶段易出现信息冗余和幻觉风险;工程落地面临高成本和多组件协同挑战;应用场景适配性有限。缓解方案包括优化检索策略(如GraphRAG)、降低工程复杂度、选用专用大模型等.

2025-12-25 16:43:42 855

原创 RAG介绍及工作流程

模型推理:将构造好的提示词输入给LLM,LLM 会利用检索到的信息,结合模型的语言生成能力,来生成准确且相关的最终答案。选用一个更强大的重排模型,更深入地理解查询和文档块之间的语义关系,并直接输出一个相关性分数,得分高的被选为最终上下文。的技术框架,核心目标是让大模型在生成回答时,能够引用外部权威、实时、精准的知识,从而解决大模型自身的固有缺陷。RAG生成的答案可附带来源引用(如参考的文档段落),让用户验证信息可靠性,提升信任感。使用与准备阶段相同的嵌入模型,将用户查询的原始问题也转换为向量。

2025-12-25 00:17:34 631

原创 统一大模型评估体系(维度+指标)

也对齐你这次提到的“指令遵循与泛化能力”、“ERNIE 4.5 多模态跨场景适应性”。也对齐你这次提到的“指令遵循与泛化能力”、“ERNIE 4.5 多模态跨场景适应性”。对应你这次单独强调的“多样性”,也和上次的“创作能力”“可控生成”有关。对应你这次单独强调的“多样性”,也和上次的“创作能力”“可控生成”有关。对应你提到的“可解释性”,也与上次的“安全性/幻觉控制”有关。对应你提到的“可解释性”,也与上次的“安全性/幻觉控制”有关。对齐你这次的:“噪声、对抗样本、复杂场景下的稳定性”。

2025-12-04 16:59:22 1157

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除