自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 LangChain 开发 Agent 第一课:理解 LangChain 并构建你的第一个工具调用 Agent

无论你想学什么技术,先知道它“是什么”,再亲手“搭一个最小示例”跑起来,是最快消除陌生感的方法。欢迎来到《Langchain开发agent》系列第一课!这一课,我们先来搞懂,然后用最少的代码,亲手搭一个能调用工具的 Agent,并以此展开说明它到底为 Agent 开发提供了哪些基础能力。

2026-05-28 15:04:15 745

原创 GenAI FinOps:Token定价的真实机制 读书笔记

对于FinOps从业者来说,真正的挑战不是“单价是多少”,而是**“在实际生产环境中,一个token到底会花掉多少钱”**。不出所料,最先进的模型(如GPT-4、Claude Opus)单价最高,而它们的“轻量版”或“快速版”(如GPT-3.5、Claude Haiku)则便宜得多。这意味着,如果你构建的是一个需要生成长文本的应用(比如报告生成、故事创作),输出token的成本会迅速主导总账单。只有一起工作,才能把技术变更与单位经济学的变化关联起来,确保每个AI驱动的用例在财务上是可行的。

2026-05-25 09:47:53 345

原创 读书笔记 GenAI FinOps vs. Cloud FinOps:同根同源,挑战各异

但GenAI的成本围绕“token”展开,而token的定义和计数方式在不同模型、不同tokenizer之间差异巨大。坏消息是:GenAI系统的独特特征带来了全新的挑战,需要专门的方法。切换到替代供应商非常复杂,通常需要不同的提示词、不同的架构,还可能面临不同的性能和成本特征。但GenAI模型是概率性的——同一个提示词,可能产生不同长度、不同质量、不同成本的输出。GenAI的概率性、对变更的极端敏感性、市场的波动性、复杂的定价和独特的运营特征,共同形成了财务管理的“完美风暴”。(因为用的人更多了)。

2026-05-25 09:44:49 437

原创 AI agent开发框架分类及适用场景分析

AI Agent开发框架的选择,本质上是在开发效率、控制粒度、团队技能、生态集成四个维度之间做权衡。追求快速验证:从LangChain或CrewAI开始,几十行代码就能出活儿。追求生产级可靠性:上LangGraph,为复杂流程和长时间运行做好准备。追求生态整合:如果你们是微软/Google的重度用户,用他们的官方框架。追求极致简单:Dify这类低代码平台可能比你想象的更强大。不要过早锁定。

2026-05-22 10:43:49 398

原创 选择AI方法与基础设施策略 读书笔记

没有唯一的正确答案。完全托管适合快速验证和早期实验;部分托管适合规模化中的平衡;自管理适合重度AI、严合规、长期稳定负载。不要跳过爬行阶段。很多企业一上来就想自己买服务器、搭集群,结果运维成本远超预期。从API开始,等真正需要了再往下走。成本可见性是一切的基础。如果连哪些资源是AI相关的都分不清,优化就无从谈起。标签、发现工具、比例分配,缺一不可。模型选择和提示词工程是性价比最高的优化手段。换一个小模型,或者把提示词精简一下,可能省下30%-50%的费用,而对效果影响极小。不同角色要坐在一起讨论。

2026-05-22 09:36:37 715

原创 FinOps for AI Overview 读书笔记:管理AI成本的新挑战与实践

这篇文章虽然内容庞杂,但提炼下来,你可以立刻做五件事:第一,为所有AI资源打上详细的标签,至少包括项目、环境、团队、成本中心。这是成本分摊和优化的基础。第二,选择一个AI项目(最好是已上线的),计算它的“每次推理成本”和“token消耗效率”,建立基线。然后尝试优化提示词或更换更小的模型,看看能否在不影响效果的前提下降低成本。第三,在云平台上为AI服务设置预算告警,比如单日花费超过平均值3倍时通知你。

2026-05-21 14:58:54 314

原创 FinOps for AI 读书笔记:当AI开始“烧钱”,我们该怎么管?

读完整份指南,最核心的感受是:FinOps for AI并没有发明一套全新的工具或法则,它只是提醒我们,面对一种新型的技术支出,需要带着同样的原则——透明、责任、经济化——去重新思考每一个环节。AI带来的变化很快,但成本管理的基本功是通用的:看清楚花了什么,判断花得值不值,然后持续改进。FinOps for AI不是一套新规则,而是一种升级后的思维方式:在支持AI快速创新的同时,让成本变得透明、可控、人人有责。它不会阻止你去尝试新的模型,也不会让你在每个创意面前畏手畏脚。

2026-05-21 11:19:46 466

原创 企业AI基建选型指南:托管/半托管/自建架构下的FinOps成本管控策略

伴随生成式AI技术快速普及,大语言模型、多模态模型已深度融入企业业务流程。传统机器学习多用于结构化数据处理、时序预测、分类回归等标准化业务;而LLM凭借自然语言理解、内容生成、知识抽取、机器翻译等能力,快速拓展复杂智能化场景。但在业务高速扩张的同时,算力成本高昂、模型可解释性弱、资源分配混乱等问题,成为制约LLM大规模商用的核心瓶颈。多数企业在AI落地阶段盲目选择云托管服务或自建算力集群,导致预算失控、资源闲置、架构冗余、合规风险放大等问题。

2026-05-18 14:24:01 410

原创 成本管控必读:GenAI FinOps与Cloud FinOps:同源架构与差异化痛点解析

现在不管是大厂还是中小企业,都在疯狂落地生成式AI。账单看不懂、成本控不住、花钱没边界。做云成本管控的同学会下意识套用Cloud FinOps(云成本优化)的思路管控AI开销,毕竟两者看着太像了:按量付费、预留折扣、资源标签、自动管控……云那套玩法,放在GenAI身上根本水土不服。同样是FinOps,看似是云FinOps的延伸,实则藏着一套全新的成本逻辑。本文用通俗易懂的方式,不带晦涩学术话术,给大家讲明白两者的相同点、本质差距,以及AI成本管控的未来方向。

2026-05-18 14:09:24 489

原创 别再无脑烧钱!生成式AI企业成本控管避坑全指南

现在企业上AI基本已成标配,但我接触过绝大多数公司都在盲目烧钱:GPT账单莫名暴涨、GPU闲置吃灰、多个部门乱调用接口、模型选型不分场景。传统云成本管理完全扛不住AI的特殊计费逻辑。本文用通俗易懂、落地直白的方式,结合行业权威白皮书,不讲空话、不堆学术术语,带大家彻底搞懂什么是AI FinOps、AI到底贵在哪、主流云厂商AI栈怎么选、7大计费模式怎么拿捏、企业如何分步落地控本。全文无晦涩公式、无生硬官方话术,适合云运维、成本管控、算法研发、技术管理者收藏阅读,看完就能上手做企业AI成本治理。

2026-05-15 16:59:21 697

原创 AI烧钱失控?一文读懂FinOps for AI,搞定大模型成本管控

本文基于 FinOps Foundation 官方文档,聚焦企业算力与大模型成本管控难题,通俗剖析 FinOps for AI 的诞生背景、行业痛点、人员角色、能力框架以及量化 KPI。结合国内企业真实运维现状,对比传统云 FinOps 差异,梳理算力分摊、预算预测、资源治理、账单标准化等落地要点,弱化行业空话、侧重实战理解,帮助研发、运维及管理者建立规范化的 AI 算力成本治理思维,为企业精细化管控算力支出提供参考

2026-05-15 16:12:38 933

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除