小阿瓦隆-CSDN博客

原创【Codex 接入国产模型API】的常见报错解决方案+codex插件接入VSCode集成指南

在使用接入国产模型时，需要手动配置文件，配置完成还会出现各种报错提示，经常会遇到流断开、404/401接口报错、Windows证书异常等问题。本文整理了高频报错的核心原因+一站式解决方案，内容亲测有效，直接照着操作即可解决问题。

2026-04-15 01:02:25 16512 1

原创 AI时代选择更合适架构选型

从零构建AI应用，优先选择AI原生架构，从底层规避后续重构成本；基于企业知识库做智能问答/客服，优先选择RAG专属架构，低成本快速落地；处理复杂自动化任务、多角色协同工作，优先选择Agent/Multi-Agent架构；规模化部署AI服务、管理大规模算力，优先选择云原生AI融合架构；实时数据流处理、低延迟AI决策，优先选择事件驱动+流处理AI架构。

2026-03-30 23:42:25 405

原创 RAG（检索增强生成）局限性的全面解析

摘要：RAG技术面临检索、推理、生成、工程和应用适配五大核心局限。检索环节存在数据预处理、召回排序和知识库维护难题；上下文窗口限制导致复杂推理能力不足；生成阶段易出现信息冗余和幻觉风险；工程落地面临高成本和多组件协同挑战；应用场景适配性有限。缓解方案包括优化检索策略（如GraphRAG）、降低工程复杂度、选用专用大模型等.

2025-12-25 16:43:42 855

模型推理：将构造好的提示词输入给LLM，LLM 会利用检索到的信息，结合模型的语言生成能力，来生成准确且相关的最终答案。选用一个更强大的重排模型，更深入地理解查询和文档块之间的语义关系，并直接输出一个相关性分数，得分高的被选为最终上下文。的技术框架，核心目标是让大模型在生成回答时，能够引用外部权威、实时、精准的知识，从而解决大模型自身的固有缺陷。RAG生成的答案可附带来源引用（如参考的文档段落），让用户验证信息可靠性，提升信任感。使用与准备阶段相同的嵌入模型，将用户查询的原始问题也转换为向量。

2025-12-25 00:17:34 631

原创统一大模型评估体系（维度+指标）

也对齐你这次提到的“指令遵循与泛化能力”、“ERNIE 4.5 多模态跨场景适应性”。也对齐你这次提到的“指令遵循与泛化能力”、“ERNIE 4.5 多模态跨场景适应性”。对应你这次单独强调的“多样性”，也和上次的“创作能力”“可控生成”有关。对应你这次单独强调的“多样性”，也和上次的“创作能力”“可控生成”有关。对应你提到的“可解释性”，也与上次的“安全性/幻觉控制”有关。对应你提到的“可解释性”，也与上次的“安全性/幻觉控制”有关。对齐你这次的：“噪声、对抗样本、复杂场景下的稳定性”。

2025-12-04 16:59:22 1157

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_42530284的博客

原创【Codex 接入国产模型API】的常见报错解决方案+codex插件接入VSCode集成指南

原创 AI时代选择更合适架构选型

原创 RAG（检索增强生成）局限性的全面解析

原创 RAG介绍及工作流程

原创统一大模型评估体系（维度+指标）

空空如也

空空如也

原创 【Codex 接入国产模型API】的常见报错解决方案+codex插件接入VSCode集成指南

原创 AI时代选择更合适架构选型

原创 RAG（检索增强生成）局限性的全面解析

原创 RAG介绍及工作流程

原创 统一大模型评估体系（维度+指标）

空空如也

空空如也

原创【Codex 接入国产模型API】的常见报错解决方案+codex插件接入VSCode集成指南

原创统一大模型评估体系（维度+指标）