自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 告别生硬交互,打造有记忆的智能助手,大模型应用基础--第五章:会话与记忆管理

大模型应用基础第五章:会话与记忆管理。用户会话隔离分清不同聊天窗口,短期会话记忆记住本轮聊天全过程,长期用户记忆记住你这个人的喜好,上下文治理防止 AI 记太多 脑子卡壳。做 AI 记忆不要一股脑把所有聊天全塞给模型,学会筛选精简,只留当下聊天能用得上的信息,既不浪费资源,又能让 AI 聊天连贯又精准。

2026-05-20 01:36:51 212

原创 AI 到底以哪些形式和人、软件产生进行交互?大模型应用基础--第四章:大模型应用基础交互形态

这一章我们关注的是“用户界面”(User Interface)与“对话体验”无论后台逻辑多么复杂,用户最终感知到的,只有AI给出的“答案”和“交互方式”。怎么聊?先从单轮开始,进阶到多轮对话。怎么显?为了让等待不枯燥,采用流式输出(打字机效果)。怎么用?为了让AI能被程序利用,要求结构化输出(JSON/代码)。怎么干?为了让AI能处理实时信息,赋予它工具调用的能力。这一章的内容是连接“大模型能力”与“用户需求”的最后一公里,也是产品设计中最能体现差异化的地方。

2026-05-18 18:46:40 520

原创 我开发的大模型应用不是玩具!大模型应用基础--第三章:大模型应用标准开发架构

本文摘要: 大模型应用应采用三层标准架构(前端层-自有业务后端-大模型API服务),实现安全稳定的商用部署。核心要点包括:1)禁止前端直接调用大模型API,密钥必须存储在后端;2)通过接口中台封装不同模型的API差异,实现灵活切换;3)采用限流、排队和全局管控三大手段应对高并发场景。这种架构设计确保了请求可查、行为可控、风险可防、账单可管,是从个人demo走向商用落地的关键。

2026-05-16 13:48:47 1102

原创 我的钱包在燃烧,Token是怎样计费的?Token计费全解与省钱攻略

本文解析了大模型Token计费的核心规则与省钱技巧。Token是文本处理的最小单位,中文1字≈1.3-2Token(国际模型)或0.4-1Token(国产模型)。计费采用输入输出分开计价模式,输出单价通常是输入的2-5倍。五大烧钱陷阱包括:上下文重复计费、系统提示词重复扣费、长文本解析消耗、深度思考模型的高成本及忽视输出费率。建议通过选择国产模型、控制上下文长度、精简提示词、限制输出字数及设置预算告警来降低成本。重点提醒避免手动拼接历史对话造成的重复计费,善用平台原生会话管理功能可显著节省费用。

2026-05-06 21:51:35 562

原创 我的钱包在燃烧,Token是怎样计费的?什么是大模型API调用?大模型应用基础--第二章:大模型API调用

我们在使用大模型的时候会有这样一个问题,大模型是烧token的,那token是怎样计费的?怎样能更加节省token?这一期我们来讲解大模型API调用是什么?大模型API的对话规则、Token 机制、调用参数、多轮对话与安全要点。在本期的学习之后你就能明白大模型API调用是什么,也能知晓大模型的token计费规则

2026-05-05 19:41:13 417

原创 Agent 架构应该如何选择?为什么我在开发项目的时候,就是对着对话框输出?

作为一个新手小白,我总听见大佬说一些隐晦的词汇,什么agent、workflow,多智能体协作。这些概念究竟是什么?为什么我在开发一个项目的时候,就是对着网页打字,对着应用对话框输出?

2026-05-04 12:00:50 783

原创 大模型应用基础--第一章:大模型底层核心认知

AI应用开发基础第一章,由浅入深学习路径第一层:认知层。【摘要】大模型的核心能力集中在语言交互与模式匹配领域,擅长自然语言处理、代码生成和轻度逻辑推理,但在实时数据、精准计算、复杂逻辑推导等方面存在明显局限。模型幻觉是其固有特性,会虚构事实和逻辑通顺的错误内容,尤其在专业领域风险显著。模型可分为通用型与垂直专用型、短上下文与长上下文型、单模态与多模态型。实际应用中需根据业务需求、成本预算和交互模态进行合理选型,通过工程手段约束幻觉,并针对不同场景采取相应技术方案补充其短板,而非盲目追求最强模型。

2026-04-30 11:34:10 951

原创 AI编程两天从0到1,我做了什么(一篇文章让你快速上手AI编程)

本文介绍了一种"文档驱动+AI施工"的高效开发模式,通过两天时间从零开发企业匿名社区MVP的实战经验,展示了如何利用AI工具完成全流程开发。作者详细拆解了该模式的三个关键环节:1)通过AI交互生成5份核心规范文档;2)将文档拆解为细粒度模块由AI生成代码;3)建立"生成-测试-调试"的闭环流程。文中特别强调文档质量的重要性,并分享了开发陷阱和实用技巧,如模块拆分、错误反馈机制等。这种无需手写代码、仅需需求管理和测试验证的模式,为技术新人提供了一条可复现的AI辅助开发路

2026-04-16 15:54:57 769 2

毕业设计+数据库数仓+网站+银行营销数据库系统+全栈项目资源包(流程清晰好上手)

项目实现了: 真实银行 CSV 数据导入 + 业务三表设计 基础 SQL 分析 + 进阶 SQL(视图 / 索引 / 存储过程 / 窗口函数) 潜力客户规则预测模型 Python & Excel 数据可视化 简易银行营销管理数据库系统 标准四层 MySQL 轻量级数据仓库建模 网站前后端搭建

2026-05-04

Agent架构选型深度解析:从业务约束到落地演进

这份文档结合了2026年中国特有的安全法与工业/服务业特征,进行了极具实操性的本土化解析,适合不满足于基本概念的你 1. 工程思维成熟:拒绝“过度设计” 文档强调“简约设计(Simple, Composable Patterns)”,并引用了反例(某SaaS企业因过度拆分Agent导致成本激增280%)。“克制”的工程哲学是区分顶级架构师与普通工程师的关键。 2. 本土化适配:直击2026年中国企业痛点,这是绝大多数AI架构文档缺失的一环。 3. 地域特色融合:以重庆为例 适合人群:具备AI系统设计经验的架构师、企业技术负责人、AI产品经理及工程团队,尤其适用于需在国内合规环境下落地AI Agent系统的研发与管理人员; 使用场景及目标:①指导企业在业务约束下科学选择AI架构,避免过度工程化;②实现从单体到多智能体的平滑演进;③构建符合中国数据安全与行业监管要求的AI系统;④通过混合架构与熔断降级机制平衡效率、成本与系统可靠性; 阅读建议:此资源兼具理论深度与工程落地细节,建议结合附录中的成本模板、合规清单与实施路线图进行实战推演,重点关注“渐进演进”与“混合架构”策略,在实际项目中通过影子模式验证新旧架构效果,确保技术选型服务于业务本质需求。

2026-05-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除