Agent加载失败-CSDN博客

原创当前大模型Agent能力面临的最大挑战是泛化性不足？

这就涉及到一个根本性问题：人类智能的本质到底是什么？

2025-09-05 16:21:02 429

原创 2025AI真正分水岭：传统Agent已落幕，代码生成式Agent才是未来！

这不是在用工具，这是在造工具！

2025-09-01 17:58:50 469

原创 AI 的关键点不是prompt，而是Context Engineering？

因为它涉及的是整个信息架构的设计，包括怎么组织信息、如何筛选相关内容、压缩冗余数据、以及隔离不同任务的上下文等等。项目的整体架构、业务逻辑、已有的代码库、依赖关系、历史bug修复记录，还有当前要解决的具体问题。，我发现即使用同样的prompt，不同的上下文环境下效果完全不一样。当我只是简单描述要把单体应用拆分成微服务的时候，它给出的方案都是教科书式的套话，但当我把现有的。比如长上下文的token消耗问题、信息冲突的处理、上下文污染的防范等等。毕竟，再聪明的AI也需要足够的信息才能做出正确的决策。

2025-08-27 16:23:34 540

原创踩坑半年总结：为什么传统AI编程工具都会变屎山？

简单说就是不要那些复杂的框架，直接用Python代码来实现Agent逻辑。

2025-08-20 17:20:13 795

原创从工具调用到代码生成：为什么说Python-use是Agent开发的未来

Python-use这个思路回归了编程的本质：code is everything

2025-08-14 14:16:38 686

原创从测评看 GPT-5：进步显著，但仍不及预期

OpenAI 联合创始人、首席执行官萨姆・奥尔特曼将 GPT-5 类比为可以按需召唤的 “博士级专家”，能够随时助力用户达成各种复杂目标，并且声称 GPT-5 在超高难度的科学问题上刷新了世界纪录，在与人类专家的对比测试中，近 70% 的场景表现更优。在 AiPy 第三期测评的 13 个参评大模型中，仅有 GLM-4.5、Doubao-Seed-1.6、Claude Sonnet 4 在交互操作类任务中表现优异，GPT-5 在此方面的不足，极大拉低了其整体竞争力。总之，GPT-5 总算亮相了。

2025-08-12 17:07:21 975

原创堆 Prompt 搞不出真 Agent！代码才是智能体的灵魂

如果你还在靠堆 Prompt 做 Agent，就像在用积木搭火箭，看似复杂，实则一碰就散。

2025-08-06 18:04:45 7844

原创 ChatGPT 垫底，Claude 领先，7月底大模型测评榜单出人意料！

ChatGPT，曾经的王者，陷入替身危机。

2025-08-01 16:36:51 2193

原创一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！

相比“远走他乡”的Manus，AiPy更像是那个留在你身边、还能本地部署的国产亲儿子。

2025-07-29 18:53:13 1750

原创 AI Agent 落地实测崩盘：成功率仅 30%，我们是不是高估了它？

在无数demo惊艳、发布会狂欢之后，现实业务场景给了用户们当头一棒：表现不稳定、执行力低下、成本控制差，说谎、误删也是家常便饭。实验室 Agent 生活在完美环境中，有清晰的API、有完备的数据、有理想的反馈。但现实世界充满模糊、延迟、冲突，Agent 脱离控制几乎是必然的。AI Agent 的未来，不在于“一个大模型包打天下”，而是有明确任务边界、有结构化输入输出、有失败补救机制以及有清晰人机交界面。真正好用的 Agent，不是让你什么都不做，而是帮你把重复做、做得慢、做得累的部分做得更快更稳。

2025-07-28 19:03:18 956