- 博客(8)
- 收藏
- 关注
原创 告别生硬交互,打造有记忆的智能助手,大模型应用基础--第五章:会话与记忆管理
大模型应用基础第五章:会话与记忆管理。用户会话隔离分清不同聊天窗口,短期会话记忆记住本轮聊天全过程,长期用户记忆记住你这个人的喜好,上下文治理防止 AI 记太多 脑子卡壳。做 AI 记忆不要一股脑把所有聊天全塞给模型,学会筛选精简,只留当下聊天能用得上的信息,既不浪费资源,又能让 AI 聊天连贯又精准。
2026-05-20 01:36:51
212
原创 AI 到底以哪些形式和人、软件产生进行交互?大模型应用基础--第四章:大模型应用基础交互形态
这一章我们关注的是“用户界面”(User Interface)与“对话体验”无论后台逻辑多么复杂,用户最终感知到的,只有AI给出的“答案”和“交互方式”。怎么聊?先从单轮开始,进阶到多轮对话。怎么显?为了让等待不枯燥,采用流式输出(打字机效果)。怎么用?为了让AI能被程序利用,要求结构化输出(JSON/代码)。怎么干?为了让AI能处理实时信息,赋予它工具调用的能力。这一章的内容是连接“大模型能力”与“用户需求”的最后一公里,也是产品设计中最能体现差异化的地方。
2026-05-18 18:46:40
520
原创 我开发的大模型应用不是玩具!大模型应用基础--第三章:大模型应用标准开发架构
本文摘要: 大模型应用应采用三层标准架构(前端层-自有业务后端-大模型API服务),实现安全稳定的商用部署。核心要点包括:1)禁止前端直接调用大模型API,密钥必须存储在后端;2)通过接口中台封装不同模型的API差异,实现灵活切换;3)采用限流、排队和全局管控三大手段应对高并发场景。这种架构设计确保了请求可查、行为可控、风险可防、账单可管,是从个人demo走向商用落地的关键。
2026-05-16 13:48:47
1102
原创 我的钱包在燃烧,Token是怎样计费的?Token计费全解与省钱攻略
本文解析了大模型Token计费的核心规则与省钱技巧。Token是文本处理的最小单位,中文1字≈1.3-2Token(国际模型)或0.4-1Token(国产模型)。计费采用输入输出分开计价模式,输出单价通常是输入的2-5倍。五大烧钱陷阱包括:上下文重复计费、系统提示词重复扣费、长文本解析消耗、深度思考模型的高成本及忽视输出费率。建议通过选择国产模型、控制上下文长度、精简提示词、限制输出字数及设置预算告警来降低成本。重点提醒避免手动拼接历史对话造成的重复计费,善用平台原生会话管理功能可显著节省费用。
2026-05-06 21:51:35
562
原创 我的钱包在燃烧,Token是怎样计费的?什么是大模型API调用?大模型应用基础--第二章:大模型API调用
我们在使用大模型的时候会有这样一个问题,大模型是烧token的,那token是怎样计费的?怎样能更加节省token?这一期我们来讲解大模型API调用是什么?大模型API的对话规则、Token 机制、调用参数、多轮对话与安全要点。在本期的学习之后你就能明白大模型API调用是什么,也能知晓大模型的token计费规则
2026-05-05 19:41:13
417
原创 Agent 架构应该如何选择?为什么我在开发项目的时候,就是对着对话框输出?
作为一个新手小白,我总听见大佬说一些隐晦的词汇,什么agent、workflow,多智能体协作。这些概念究竟是什么?为什么我在开发一个项目的时候,就是对着网页打字,对着应用对话框输出?
2026-05-04 12:00:50
783
原创 大模型应用基础--第一章:大模型底层核心认知
AI应用开发基础第一章,由浅入深学习路径第一层:认知层。【摘要】大模型的核心能力集中在语言交互与模式匹配领域,擅长自然语言处理、代码生成和轻度逻辑推理,但在实时数据、精准计算、复杂逻辑推导等方面存在明显局限。模型幻觉是其固有特性,会虚构事实和逻辑通顺的错误内容,尤其在专业领域风险显著。模型可分为通用型与垂直专用型、短上下文与长上下文型、单模态与多模态型。实际应用中需根据业务需求、成本预算和交互模态进行合理选型,通过工程手段约束幻觉,并针对不同场景采取相应技术方案补充其短板,而非盲目追求最强模型。
2026-04-30 11:34:10
951
原创 AI编程两天从0到1,我做了什么(一篇文章让你快速上手AI编程)
本文介绍了一种"文档驱动+AI施工"的高效开发模式,通过两天时间从零开发企业匿名社区MVP的实战经验,展示了如何利用AI工具完成全流程开发。作者详细拆解了该模式的三个关键环节:1)通过AI交互生成5份核心规范文档;2)将文档拆解为细粒度模块由AI生成代码;3)建立"生成-测试-调试"的闭环流程。文中特别强调文档质量的重要性,并分享了开发陷阱和实用技巧,如模块拆分、错误反馈机制等。这种无需手写代码、仅需需求管理和测试验证的模式,为技术新人提供了一条可复现的AI辅助开发路
2026-04-16 15:54:57
769
2
毕业设计+数据库数仓+网站+银行营销数据库系统+全栈项目资源包(流程清晰好上手)
2026-05-04
Agent架构选型深度解析:从业务约束到落地演进
2026-05-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅