call_xiangyj-CSDN博客

原创告别生硬交互，打造有记忆的智能助手，大模型应用基础--第五章：会话与记忆管理

大模型应用基础第五章：会话与记忆管理。用户会话隔离分清不同聊天窗口，短期会话记忆记住本轮聊天全过程，长期用户记忆记住你这个人的喜好，上下文治理防止 AI 记太多脑子卡壳。做 AI 记忆不要一股脑把所有聊天全塞给模型，学会筛选精简，只留当下聊天能用得上的信息，既不浪费资源，又能让 AI 聊天连贯又精准。

2026-05-20 01:36:51 212

原创 AI 到底以哪些形式和人、软件产生进行交互？大模型应用基础--第四章：大模型应用基础交互形态

这一章我们关注的是“用户界面”（User Interface）与“对话体验”无论后台逻辑多么复杂，用户最终感知到的，只有AI给出的“答案”和“交互方式”。怎么聊？先从单轮开始，进阶到多轮对话。怎么显？为了让等待不枯燥，采用流式输出（打字机效果）。怎么用？为了让AI能被程序利用，要求结构化输出（JSON/代码）。怎么干？为了让AI能处理实时信息，赋予它工具调用的能力。这一章的内容是连接“大模型能力”与“用户需求”的最后一公里，也是产品设计中最能体现差异化的地方。

2026-05-18 18:46:40 520

原创我开发的大模型应用不是玩具！大模型应用基础--第三章：大模型应用标准开发架构

本文摘要：大模型应用应采用三层标准架构（前端层-自有业务后端-大模型API服务），实现安全稳定的商用部署。核心要点包括：1）禁止前端直接调用大模型API，密钥必须存储在后端；2）通过接口中台封装不同模型的API差异，实现灵活切换；3）采用限流、排队和全局管控三大手段应对高并发场景。这种架构设计确保了请求可查、行为可控、风险可防、账单可管，是从个人demo走向商用落地的关键。

2026-05-16 13:48:47 1102

原创我的钱包在燃烧，Token是怎样计费的？Token计费全解与省钱攻略

本文解析了大模型Token计费的核心规则与省钱技巧。Token是文本处理的最小单位，中文1字≈1.3-2Token（国际模型）或0.4-1Token（国产模型）。计费采用输入输出分开计价模式，输出单价通常是输入的2-5倍。五大烧钱陷阱包括：上下文重复计费、系统提示词重复扣费、长文本解析消耗、深度思考模型的高成本及忽视输出费率。建议通过选择国产模型、控制上下文长度、精简提示词、限制输出字数及设置预算告警来降低成本。重点提醒避免手动拼接历史对话造成的重复计费，善用平台原生会话管理功能可显著节省费用。

2026-05-06 21:51:35 562

原创我的钱包在燃烧，Token是怎样计费的？什么是大模型API调用？大模型应用基础--第二章：大模型API调用

我们在使用大模型的时候会有这样一个问题，大模型是烧token的，那token是怎样计费的？怎样能更加节省token？这一期我们来讲解大模型API调用是什么？大模型API的对话规则、Token 机制、调用参数、多轮对话与安全要点。在本期的学习之后你就能明白大模型API调用是什么，也能知晓大模型的token计费规则

2026-05-05 19:41:13 417

原创 Agent 架构应该如何选择？为什么我在开发项目的时候，就是对着对话框输出？

作为一个新手小白，我总听见大佬说一些隐晦的词汇，什么agent、workflow，多智能体协作。这些概念究竟是什么？为什么我在开发一个项目的时候，就是对着网页打字，对着应用对话框输出？

2026-05-04 12:00:50 783

原创大模型应用基础--第一章：大模型底层核心认知

AI应用开发基础第一章，由浅入深学习路径第一层：认知层。【摘要】大模型的核心能力集中在语言交互与模式匹配领域，擅长自然语言处理、代码生成和轻度逻辑推理，但在实时数据、精准计算、复杂逻辑推导等方面存在明显局限。模型幻觉是其固有特性，会虚构事实和逻辑通顺的错误内容，尤其在专业领域风险显著。模型可分为通用型与垂直专用型、短上下文与长上下文型、单模态与多模态型。实际应用中需根据业务需求、成本预算和交互模态进行合理选型，通过工程手段约束幻觉，并针对不同场景采取相应技术方案补充其短板，而非盲目追求最强模型。

2026-04-30 11:34:10 951

原创 AI编程两天从0到1，我做了什么（一篇文章让你快速上手AI编程）

本文介绍了一种"文档驱动+AI施工"的高效开发模式，通过两天时间从零开发企业匿名社区MVP的实战经验，展示了如何利用AI工具完成全流程开发。作者详细拆解了该模式的三个关键环节：1）通过AI交互生成5份核心规范文档；2）将文档拆解为细粒度模块由AI生成代码；3）建立"生成-测试-调试"的闭环流程。文中特别强调文档质量的重要性，并分享了开发陷阱和实用技巧，如模块拆分、错误反馈机制等。这种无需手写代码、仅需需求管理和测试验证的模式，为技术新人提供了一条可复现的AI辅助开发路

2026-04-16 15:54:57 769 2

毕业设计+数据库数仓+网站+银行营销数据库系统+全栈项目资源包（流程清晰好上手）

项目实现了：真实银行 CSV 数据导入 + 业务三表设计基础 SQL 分析 + 进阶 SQL（视图 / 索引 / 存储过程 / 窗口函数）潜力客户规则预测模型 Python & Excel 数据可视化简易银行营销管理数据库系统标准四层 MySQL 轻量级数据仓库建模网站前后端搭建

2026-05-04

Agent架构选型深度解析：从业务约束到落地演进

这份文档结合了2026年中国特有的安全法与工业/服务业特征，进行了极具实操性的本土化解析，适合不满足于基本概念的你 1. 工程思维成熟：拒绝“过度设计” 文档强调“简约设计（Simple, Composable Patterns）”，并引用了反例（某SaaS企业因过度拆分Agent导致成本激增280%）。“克制”的工程哲学是区分顶级架构师与普通工程师的关键。 2. 本土化适配：直击2026年中国企业痛点，这是绝大多数AI架构文档缺失的一环。 3. 地域特色融合：以重庆为例适合人群：具备AI系统设计经验的架构师、企业技术负责人、AI产品经理及工程团队，尤其适用于需在国内合规环境下落地AI Agent系统的研发与管理人员；使用场景及目标：①指导企业在业务约束下科学选择AI架构，避免过度工程化；②实现从单体到多智能体的平滑演进；③构建符合中国数据安全与行业监管要求的AI系统；④通过混合架构与熔断降级机制平衡效率、成本与系统可靠性；阅读建议：此资源兼具理论深度与工程落地细节，建议结合附录中的成本模板、合规清单与实施路线图进行实战推演，重点关注“渐进演进”与“混合架构”策略，在实际项目中通过影子模式验证新旧架构效果，确保技术选型服务于业务本质需求。

2026-05-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人