- 博客(151)
- 资源 (1)
- 收藏
- 关注
原创 Cursor + Claude 3.7:AI编程效率提升300%的实战心法
✅样板代码生成常见算法实现代码重构和优化单元测试编写技术文档生成⚠️复杂业务逻辑安全敏感代码架构设计决策性能关键路径。
2026-05-31 10:20:21
217
原创 LoRA微调实战:从理论到LLaMA-3高效微调
LoRA技术降低了大模型微调的门槛,让个人开发者和中小企业也能定制专属AI。理解原理:低秩分解的数学直觉数据为王:高质量数据比复杂技巧更重要从小试起:先用小rank试验,逐步扩展监控调优:关注loss曲线和验证集表现。
2026-05-31 10:19:52
347
原创 LLM推理优化与KV Cache机制深度解析
标准Transformer每次重新计算# 每次都重新计算所有位置的K、V# 使用KV Cache后kv_cache = {} # 缓存已计算的K、VK, V = kv_cache[i] # 直接读取缓存else:kv_cache[i] = (K, V) # 存入缓存KV Cache是推理加速的基石,减少重复计算解决内存碎片,提升吞吐量打破静态批次限制量化压缩降低显存,提升速度。
2026-05-31 10:18:44
314
原创 中国AI大模型调用量2.11倍领先美国:腾讯Hy3蝉联第一,DeepSeek三款上榜,深度解读全球AI格局
维度关键数据🏆 中美对比中国2.11倍领先美国👑 榜首腾讯— 2.68万亿Token/周🚀 增长之星— 首次上榜+99%增长📊 全球总量25.7万亿Token/周(连续三周上涨)🇨🇳 中国力量Top 10中占据多席,全面崛起核心结论:中国AI产业已经从"追赶者"变成了"引领者"——不是在论文数量上,而是在真实世界的产品应用和用户采纳上。调用量是最诚实的投票,而中国正在赢得这场投票。
2026-05-30 22:38:42
390
原创 微服务拆了100+个后,我才真正理解治理的残酷真相——从雪崩到涅槃的全链路治理实战
1. 微服务治理是一个系统工程,不是几个中间件的堆砌很多人以为引入Nacos + Sentinel + SkyWalking就完成了治理,这是严重的误解。真正的治理需要覆盖服务的全生命周期,需要组织、流程、技术三方面的协同。2. 治理的核心目标是"可观测"和"可控制"可观测:知道系统在发生什么(指标、日志、链路);可控制:能对系统施加影响(限流、熔断、降级、灰度)。3. 没有银弹,只有trade-off强一致性 vs 最终一致性、性能 vs 可靠性、功能丰富 vs 轻量简洁——每一个技术选型都是在做权衡。
2026-05-30 06:44:51
218
原创 AI智能体(Agent)时代全面到来:从编程助手到“无人公司“,2026年最值得关注的AI趋势
│ AI Agent 四大能力 ││ ││ 🧠 感知(Perception) ││ → 理解环境、接收多模态输入 ││ ││ 🎯 规划(Planning) ││ → 将复杂目标拆解为可执行步骤 ││ ││ 🔧 行动(Action) ││ → 调用工具、执行操作、产生效果 ││ ││ 📚 记忆(Memory) ││ → 跨会话学习、经验积累 ││ │传统公司AI原生组织员工做执行Agent做执行经理做管理人做决策+监督层级汇报扁平化协同固定工时7×24运行角色。
2026-05-30 06:40:33
530
原创 2026具身智能深度报告:从实验室到商用的关键跨越,五大榜单登顶与千亿市场
*具身智能(Embodied AI)**是指AI系统不仅具备"大脑"(大模型),还拥有"身体"(机器人硬件),能够通过感知、推理和物理交互来理解和影响真实世界。传统AI: 输入(文本/图像) → 大模型 → 输出(文本/图像)↑只在数字世界运行具身智能: 传感器输入 → 大模型决策 → 物理动作 → 环境反馈 → ...↑在物理世界中运行!维度2025年之前2026年📍 阶段开发态/演示部署态/商用🎯 目标展示能力交付结果💰 模式卖硬件卖服务(RaaS)📊 证据演示视频。
2026-05-30 06:40:02
526
原创 OpenAI GPT-5 Agent Mode 正式发布:最长24小时自主任务,AI编程智能体大战升级
传统ChatGPT模式:用户提问 → AI回答 → 用户再提问 → AI再回答 → ...(被动响应)用户设定目标 → AI自主规划 → 自动调用工具 → 执行多步操作 → 交付结果(主动执行,可运行长达24小时!维度评价🚀 创新性⭐⭐⭐⭐⭐ 24小时自主任务是业界首创💰 可及性⭐⭐⭐⭐ $20/月起,个人开发者可接受⚔️ 竞争力⭐⭐⭐⭐ 与Claude Code各有千秋🌍 影响力⭐⭐⭐⭐⭐ 引领全球AI Agent浪潮🇨🇳 国内替代。
2026-05-29 21:25:15
617
原创 智谱AI完成5亿美元融资 + AutoGLM 2.0发布:对标GPT-5 Agent Mode
维度意义💰 5亿美元融资为后续研发提供充足"弹药"补齐Agent能力短板,直面国际竞争🏆 TIME认可 + 开源第一品牌影响力达到新高度🤝 阿里腾讯合投互联网巨头的战略级押注。
2026-05-29 12:37:56
566
原创 2026年5月大模型选型指南:15+主流模型全维度对比(含最新Gemini 3.5 & Qwen3.7)
最终推荐矩阵:综合性能 性价比 速度 安全合规 开源编程开发 Claude4.7 DS-V4 Gemini GLM-5.1 DS-V4长文档 Kimi-K2.6 Kimi Claude — LLaMA4实时交互 Gemini3.5 Gemini Gemini — DS-Flash企业级中文 GLM-5.1 豆包 — GLM-5.1 Qwen私有化部署 DS-V4-Pro DS-Flash DS-Flash DS-V4-Pro DS-V4-Pro。
2026-05-29 12:37:30
621
原创 DeepSeek R2 开源:670B MoE 训练成本仅550万美元,全面超越 LLaMA 4
传统Dense模型:输入 → [全部参数激活] → 输出MoE模型:输入 → [路由器选择部分专家] → [仅激活的专家处理] → 输出↑只激活一小部分参数!维度评价💰 性价比⭐⭐⭐⭐⭐ 550万美元训练出超越LLaMA 4的模型📊 性能⭐⭐⭐⭐⭐ 多项基准超越前代最强开源🌍 影响力⭐⭐⭐⭐⭐ 24h 50万下载,全球关注🔓 开放度⭐⭐⭐⭐⭐ 持续开源路线,推动生态繁荣🎯 战略意义⭐⭐⭐⭐⭐ 中国AI硬核实力的集中展示。
2026-05-29 08:11:28
539
原创 全国首款!智元WITA具身智能交互大模型完成备案,2026“部署态元年“来了
WITA是智元机器人面向人形机器人交互场景打造的具身智能交互大模型维度描述全称WITA(硅光动语)核心能力自然拟人的情感交互目标让机器人从"会说话的工具"升级为有连续感、人格感的**“硅基伙伴”**应用场景导览、导购、导引、服务零售站阶段特征时间开发态实验室演示、单点炫技2026年之前部署态真实场景稳定、连续、规模化运行2026年起层面意义🏛️ 政策具身智能纳入合规框架,行业发展有章可循🏭 产业从demo到商用的关键转折点🤖 技术交互智能达到"硅基伙伴"级别💰 商业。
2026-05-29 08:10:57
489
原创 DDD落地3年踩了27个坑,我用这套方法论让团队从抵触到真香
第一阶段:认知对齐(1-2周)组织Event Storming工作坊,统一团队认知建立团队共享的领域术语表明确限界上下文边界第二阶段:模型设计(2-4周)设计领域模型,识别实体、值对象、聚合根设计领域事件,明确上下文之间的通信方式设计API接口,明确上下文之间的交互协议第三阶段:迭代实施(持续)从核心领域开始,逐步扩展到支撑领域每个迭代进行领域模型评审持续重构,优化模型设计第四阶段:持续优化(持续)监控系统性能,优化热点路径收集团队反馈,改进开发流程。
2026-05-28 19:20:42
292
原创 Google I/O 2026 重磅:Gemini 3.5 Flash 全面上线,284 token/s碾压式速度
Google正在以"速度+多模态+Agent"三维一体的策略全面反击。维度代表产品竞争力评估⚡ 速度⭐⭐⭐⭐⭐ 284 token/s碾压全场🎨 多模态⭐⭐⭐⭐⭐ MMMU-Pro超越GPT-5.5🤖 Agent⭐⭐⭐⭐ 潜力巨大,需关注安全📱 移动端Android深度集成⭐⭐⭐⭐⭐ 生态优势明显对于国内开发者而言,虽然Gemini系列在国内直接访问存在限制,但其技术路线和设计思路仍具有重要参考价值。
2026-05-28 18:24:48
472
原创 AI安全治理2026:从“炫模型“到“拼安全“,中国AI治理框架加速落地
2026年成为AI辅助攻击元年。The Hacker News报道:AI大幅降低了网络攻击门槛,导致7亿用户数据泄露事件发生,网络攻击速度与规模显著升级。🇺🇸 美国佛罗里达州检方就枪击案对OpenAI发起刑事调查🇺🇸 谷歌确认黑客利用AI独立发现零日漏洞🇨🇳 中国三部门联合印发《智能体规范应用与创新发展实施意见》🌍 EU AI Act合规期限(2026年8月)临近行业重心正在从“谁的模型更强大”转向“谁的安全做得更好”。本文将全面梳理AI安全治理的最新动态和企业的应对策略。关键词含义🛡️。
2026-05-28 12:33:32
408
原创 多智能体协作系统:从单兵作战到军团协同
支持循环和条件分支状态管理清晰可视化工作流协作模式选择:根据场景选择管道式、分层式或辩论式通信标准化:使用A2A等协议确保互操作性监控与优化:建立完善的监控体系,持续优化性能容错设计:设计故障转移和重试机制。
2026-05-28 12:32:07
463
原创 AI智能体的安全与治理:挑战、框架与实践指南
✅ 正常情况:自动分类邮件、回复常见问题❌ 极端情况:被诱导发送敏感数据给攻击者这不是危言耸听。随着Agent能力增强,其潜在风险也在增加。技术层面:深度防御、沙箱隔离、可观测性管理层面:政策规范、审批流程、审计机制人员层面:安全意识、技能培训、责任明确只有将安全治理贯穿于Agent的全生命周期,才能真正释放AI Agent的价值,同时控制风险。参考资料《智能体规范应用与创新发展实施意见》Google Cloud《AI Agent安全最佳实践》本文仅供学习交流,如有侵权请联系删除标签。
2026-05-28 08:06:36
363
原创 小米MiMo-V2.5全系暴跌99%!AI大模型价格战进入白热化,开发者狂欢时代来了
MiMo-V2.5全系模型大幅调价,最高降幅99%。当我看到这个数字的时候,第一反应是"是不是写错了"。99%的降幅,这意味着什么?意味着原来需要100块钱的推理成本,现在只需要1块钱。意味着原来只有大厂才能玩得起的AI应用,现在个人开发者也能轻松负担。这不是小米第一次在AI领域发力,但这次的价格调整,无疑是小米在AI大模型赛道上打出的最响亮的一枪。模型输入(命中缓存)输入(未命中缓存)输出¥0.025/百万tokens¥3/百万tokens¥6/百万tokensMiMo-V2.5。
2026-05-27 22:20:28
345
原创 云原生架构演进实战:从单体到K8s的血泪迁移之路,这5个阶段踩过的坑比代码还多
云原生计算基金会(CNCF)对云原生的定义经历了多次迭代,当前版本的核心表述是:用容器打包、用编排平台调度、用微服务拆分、用声明式API管理、用服务网格治理,最终实现应用的弹性伸缩和快速迭代。阶段一:容器化核心目标:应用可打包、环境一致性关键动作:Dockerfile优化、多阶段构建、镜像安全扫描最大坑点:配置硬编码、镜像臃肿阶段二:容器编排核心目标:应用可调度、可伸缩关键动作:K8s集群搭建、Deployment/Service/Ingress、资源限制。
2026-05-27 22:05:44
520
原创 AI智能体商业化落地:B端应用场景与价值创造实践
AI智能体正在从概念走向规模化商业应用。选对场景:从高价值、可量化的场景切入重视治理:安全和合规不容忽视人机协同:Agent是增强人类,而非替代持续优化:基于反馈不断改进2026年是AI Agent商业化元年,现在正是布局的最佳时机!参考资料Gartner《AI Agent商业化应用报告》中国工业互联网研究院《AI Agent智能体技术发展报告》开源证券《AI Agent行业深度报告》本文仅供学习交流,如有侵权请联系删除标签AI商业化B端应用企业级AgentROI数字化转型版权声明。
2026-05-27 21:35:31
536
原创 2026年AI智能体(Agent)十大技术趋势深度解析
回顾过去两年,AI Agent领域经历了令人瞩目的发展。从2024年初的简单问答和工具调用,到2025年多模态能力爆发,再到2026年的规模化商用,AI Agent正从"被动响应工具"进化为"主动执行助手"。根据Gartner最新预测,到2028年,约33%的企业软件应用将内嵌代理型AI,而2024年这一比例尚不足1%;与此同时,15%的日常工作决策将由这些智能体自主完成。2026年的AI Agent技术正在经历一场深刻的范式跃迁。
2026-05-27 12:55:11
1179
原创 AI Agent入门:从零搭建你的第一个智能助手
你是一位专业的天气助手。你的职责是:1. 理解用户询问的是哪个城市的天气2. 调用天气查询工具获取信息3. 用友好、易懂的方式回复用户注意事项:- 如果用户没指定城市,主动询问- 如果查询失败,礼貌告知用户- 不要编造天气数据,只能使用工具返回的真实数据。
2026-05-27 12:51:01
238
原创 第一季总结:从聊天窗口到可演化系统的十个教训
搭建AI系统,像是在养育一个数字生命。它需要清晰的边界,也需要成长的空间。它需要你的设计,也需要你的放手。它会在你意想不到的地方犯错,也会在你绝望时给出惊喜。享受这个过程吧。
2026-05-27 08:15:01
403
原创 提示词工程实战:让Agent真正理解你的意图
AI系统架构实践者2026-05-27人工智能 · Prompt工程 · 实战技巧AI AgentLLM提示词优化。
2026-05-27 08:14:31
229
原创 Python后端开发实战:FastAPI构建高性能RESTful API完整指南
Router层:定义接口路径、HTTP方法、请求/响应模型Schema层:Pydantic 数据校验与序列化Service层:业务逻辑处理Model层:SQLAlchemy ORM 数据库操作。
2026-05-26 20:25:43
264
原创 Python列表、字典、集合高阶操作精讲:从基础到工程实战
列表:推导式提升可读性和效率,sortedkey应对复杂排序,简化遍历逻辑字典:推导式+Counter+defaultdict是数据聚合利器,Python 3.9+的合并更简洁集合:天然去重,集合运算(交并差)是数据对比清洗的最优方案掌握这三大结构的高阶操作,能将日常数据处理效率提升3-5倍,也是通过大厂Python面试的必备能力。
2026-05-26 20:19:03
440
原创 Agent记忆系统设计:短期记忆与长期沉淀
想象一下:你和一个朋友聊天,每说一句话,他就忘了之前说过什么。你得不断重复背景信息,对话根本无法深入。这就是没有记忆系统的Agent。记忆对Agent的意义:我设计了一个三层记忆模型:三、工作记忆:当前任务的"草稿纸"作用 存放当前任务的关键信息 作为推理过程的临时工作区 供工具调用时读取参数实现方式方案A:直接放在提示词上下文方案B:结构化存储最佳实践 保持精简,只放当前任务相关 定期清理已完成的信息 关键决策点要显式记录四、短期记忆:会话的"
2026-05-26 19:12:40
487
原创 多Agent通信协议设计:从松耦合到强协作
类型用途示例分配任务"请写一份报告"返回结果"报告已完成"query查询信息"请提供某数据"notify状态通知"任务已超时"error错误报告"处理失败,原因..."多Agent系统的通信协议,本质是社会契约的数字版本。明确的职责分工清晰的沟通渠道共同的决策机制完善的异常处理Agent团队也一样。设计好的协议,Agent们才能高效协作,而不是互相干扰。
2026-05-26 11:35:05
367
原创 深入拆解 Transformer 注意力机制:从 MHA 到 MLA,大模型性能跃迁的底层密码
在保持模型表达能力的前提下,最大化计算与显存效率。技术核心收益代表模型MHA建立基础能力MQA/GQAKV Cache 压缩MLA极致 KV Cache 压缩IO 效率优化几乎所有现代模型稀疏注意力超长上下文支持未来,随着百万级 token 长上下文成为标配,以及多模态输入(图像、音频、视频帧)的引入,注意力机制的创新仍将持续。理解这些底层机制,是进行大模型工程优化与应用落地的必备基础。
2026-05-25 21:52:28
546
原创 当AI系统开始记录自己的演化史
层次内容示例事件层发生了什么某时刻执行了某任务,耗时X秒,结果Y模式层什么在重复每周三上午是任务高峰,某Agent经常被调用演化层什么在变化相比上周,某指标上升/下降,可能原因是Z大部分系统停留在事件层(打日志)。有些能做到模式层(报表统计)。但演化层需要系统具备某种"元认知"——不仅能执行任务,还能理解任务之间的关系和变化趋势。
2026-05-25 19:49:00
523
原创 SuperSplat 架构深度解析:8.2K Star 的浏览器端 3D 高斯泼溅编辑器,PlayCanvas 如何用纯 WebGL 重新定义三维内容工作流
2023 年 SIGGRAPH 大会上,3D Gaussian Splatting(3DGS)横空出世——用数百万个半透明椭球体重建真实场景,实时渲染 60fps+,彻底碾压 NeRF。生成之后怎么编辑?传统 3DGS 管线是单向的——扫描 → 训练 → 输出 .ply 文件 → 结束。没有编辑器,没有优化工具,没有发布管线。你拿到的是一个几百 MB 的二进制文件,除了「看」,什么都做不了。PlayCanvas 团队看到了这个空白。2024 年初,他们开源了SuperSplat。
2026-05-25 19:48:06
532
原创 Easy-Vibe 架构深度解析:12K Star 的 Vibe Coding 入门课程,Datawhale 如何把「会说话就会做应用」变成现实
2026 年 1 月 1 日,Datawhale 联合清华大学深圳国际研究生院 Open FIESTA AIID 课程团队,正式开源了一个「零基础 AI 编程入门课程」——Easy-Vibe。仅仅四个多月,12.1K Star、1.1K Fork、10 种语言。这组数据本身不稀奇——Datawhale 在中文开源社区有极强的号召力。但真正让我感兴趣的是这个项目的设计哲学“If you can talk, you can build apps. 会说话就会做应用”这不是一句营销口号。
2026-05-25 19:47:03
570
原创 UI-TARS Desktop 深度解析:字节跳动 34K Star 的多模态 AI Agent 栈
2025 年 1 月,字节跳动在 arXiv 发布论文《UI-TARS: Pioneering Automated GUI Interaction with Native Agents》,首次提出了一个端到端原生 GUI Agent 模型——不依赖 OCR、不依赖无障碍接口、不依赖平台原生 API,仅靠「看屏幕」就能操作电脑。6 个月后,完整的技术栈在 GitHub 开源,斩获。这不仅是又一个 AI 工具。这是人机交互方式的范式转移。数据数值34.3K⭐Fork 数3.4K发布版本38 个。
2026-05-24 10:00:45
612
原创 登顶国产第一!阿里千问Qwen3.7-Max深度解析:可自主完成35小时硬核任务
方向意义🏆 性能登顶Arena盲测国产第一,逼近国际顶尖水平🤖 Agent原生面向智能体场景全新设计,非简单能力叠加⏱️ 长程自主35小时任务验证,开创性展示自我演进潜力随着API即将上线百炼平台,开发者将很快能够体验这款"全能智能体新基座"的实际威力。
2026-05-24 09:44:52
2167
原创 AI Agent系统设计:稳定性不是靠模型更聪明,而是靠减少例外
DeepLogic2026-05-23人工智能 · 系统架构 · 工程实践AI Agent系统稳定性流程设计工程化。
2026-05-23 19:21:29
601
原创 构建AI Agent系统的可观测性:从“盲目信任“到“可视化治理“
哪些配置该清理哪些映射不准确哪些任务缺少交付物验证哪些统计需要兜底机制但这其实是好事。以前这些问题藏在文件系统、日志和会话里,你不翻不知道。现在它们出现在页面上,你就躲不掉了。哪里不正常哪里可能不正常哪里看起来正常但需要复核构建AI Agent系统,可观测性是一切治理的基础。复杂系统不能只靠相信,你得看见它怎么跑。看见服务状态,看见配置挂载,看见任务链路,看见资源消耗,看见自动化有没有真的交付。只有先"能看见",才能谈得上"可治理"。
2026-05-23 19:19:26
652
原创 从玩具到生产:企业级 Agent 平台需要什么样的 CLI 工具
最近阿里云开源了 AgentRun CLI(GitHub: Serverless-Devs/agentrun-cli),这是一个值得关注的信号。安装后本地会多出一个ar命令,开发者可以通过它在终端里创建、运行、部署和管理 AgentRun 平台上的托管 Super Agent。初看这个项目,可能会觉得"不过是又一个 Agent 命令行工具"。但深入代码和文档后,我发现它的设计思路代表了 Agent 平台化的一条重要路径——把 Agent 当成云原生资源来管理。Agent 应该被当作生产资源来管理。
2026-05-23 19:11:06
480
原创 火山方舟Agent Plan牵手DeepSeek V4:AI开发者的性价比新选择
DeepSeek V4的接入,让Agent Plan的性价比又上了一个台阶。对于想试水AI Agent开发、或者正在找更省心方案的开发者来说,200元/月的Medium套餐确实是个不错的起点。当然,技术选型没有银弹。建议先用Small套餐体验一波,验证场景后再决定是否升级。毕竟,适合自己的才是最好的。参考链接:火山方舟官方文档标签:#DeepSeekV4 #火山方舟 #AgentPlan #AI开发 #大模型应用。
2026-05-23 19:01:30
549
原创 Hello-Agents 深度解析:从零构建智能体,50K+ Star 的中文 Agent 圣经
2024 年是"百模大战"元年,2025 年开启了"Agent 元年"。技术焦点正从训练更大的基础模型,转向构建更聪明的智能体应用。会用 Dify/Coze 不等于懂 Agent。你拖拖拽拽搭了个工作流,但:LLM 为什么这样思考?ReAct 循环怎么实现?多 Agent 怎么协作?记忆系统怎么设计?——一片空白。就是这个空白的答案。数据数值50.3K⭐Fork 数6.1K版本V1.0.2许可证适配人群Python 基础 + LLM API 了解即可。
2026-05-23 12:48:06
552
原创 面向 AI Coding 工具的路由网关:9Router 全架构深度解析
你有 Claude Code 订阅($20/月),但 5 小时配额总在关键时刻耗尽你有 Cursor Pro,但速率限制频繁中断编码你有 Codex、Cline、Copilot……每个工具都有不同的 API 格式和认证方式你想用免费的 Kiro AI 和 Vertex AI 做兜底,但配置起来无比麻烦你的 Token 账单越来越贵,其中 30-50% 被git diffgrep等工具输出浪费了9Router就是为了解决这一系列问题而生的本地路由网关。
2026-05-23 10:08:56
575
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅