- 博客(1365)
- 资源 (23)
- 收藏
- 关注
原创 7个领先的AI可观察性平台
将大型语言模型(LLM)集成到企业工作流程中非常易于访问。但在生产环境中理解这些系统的非确定性 AI 行为,提出了巨大的运营挑战。AI 可观察性工具提供了对遥测数据的深度可见性,从而能够在整个技术栈中进行根本原因分析和性能优化。什么是 AI 可观察性?AI 可观察性是在生产环境中监控、跟踪和分析 AI 和机器学习系统,以确保其可靠性、性能和问责制的实践。虽然传统的 IT 监控工具是构建来跟踪确定性系统健康指标的,但当应用于机器学习的概率性质时,它们显得不足。
2026-02-28 01:15:42
382
原创 PII、越狱和真正的护栏
我们正在构建越来越多的 AI 智能体来处理真实的公司数据。这些数据通常包含 PII(个人身份信息)——电子邮件地址、电话号码、出生日期和客户案例描述。即使拥有企业 LLM 许可证,一个令人不安的问题仍然存在:我们在法律上和技术上是否允许将那些数据发送到外部 LLM 提供商?许多团队假设"企业许可证 = 安全"。但合规性、日志记录、痕迹存储和数据驻留权讲述了一个更复杂的故事。一周前,我观看了的发布会演示——这是一个承诺提供安全 AI 工作空间的产品。
2026-02-28 01:14:14
298
原创 编程语言的终结
如果人类不再是代码的主要作者,而所有未来的软件都由 AI 编写,那么编程语言(所有编程语言)代表了超过 90% 的无效开销。程序员编写的内容中大约 97% 不是计算。它是向可能阅读其代码的机器和其他人类进行的沟通。人类认为自己想要的内容与计算系统可以理解/执行/验证的内容之间的距离——这个差距——是未来十年软件工程的定义性挑战。我称之为"预测,在未来十年内,AI 将取代超过 6.34 亿个工作岗位。
2026-02-28 01:12:23
356
原创 构建内部AI助手值得吗?
今年我加入 IBM 作为实习实习生,几乎立即被指派构建一个 AI 助手来分析配置文件并确定是否从 IBM 软件的一个版本升级到另一个版本会为客户引入破坏性变更。在那之前,我对 AI 的经历是……使用 ChatGPT 进行研究,偶尔要求它帮助我调试大学作业。这就是我的 “AI 工程” 背景的程度任务本身似乎可以完成,特别是所有 “三步构建你自己的 AI!” 的材料都在那里。潜在的好处很明确:遍历配置文件通常(正如我很快发现的)需要几天时间 — 一个人需要具备适当的 IBM 软件产品知识。
2026-02-28 01:11:13
391
原创 STM32运行机器学习模型
在本文中,使用了一个 STM32F103C8T6 “蓝板” 微控制器板来收集输入数据,以便在机器学习过程中训练模型。数据代表了一对简单的 “敲击” 模式,作为敲击之间的时间间隔。训练是使用 Tensor Flow 进行的。最初,模型在桌面上运行,因为 STM32 家族中相对较小的成员无法方便地运行 Tensor Flow。在随后的文章中,模型在另一个微控制器上运行 — 更强大的 ESP32-C6。这个设备的限制比 F103 少得多,它拥有 20KB 的 RAM。
2026-02-28 01:08:49
351
原创 用 MLX 进行机器学习研究
大多数机器学习研究都在运行 PyTorch 的 NVIDIA 硬件上进行。工具链成熟,生态系统庞大,如果你需要从 Transformer 中提取内部表示来进行探测实验,你会使用 HuggingFace 和 CUDA GPU。这是默认路径,而且效果很好。我选择了一条更便宜的路。过去几个月里,我一直在 Apple Silicon 上运行一个实验流程,用于 LLM 行为研究,MLX 是我为一篇正在准备中的论文使用的主要研究平台。
2026-02-28 01:07:25
259
原创 模型利用才是关键!
每隔几周,就会有一个新的模型发布,社交媒体上会充满各种图表。基准测试分数上升几个点。截图显示完美的多项选择答案。这看起来像一场永无止境的比赛。然而,当你要求代理完成一项真正的工作,比如完成功能、运行研究项目或准备法律风格备忘录时,它仍然经常失败而不是成功。最近的代理基准测试模拟了现实的专业工作,比如 TheAgentCompany 和类似的研究项目环境,显示了一些令人不安的结果。即使是前沿模型,包裹在深思熟虑的代理中,也只完成少数复杂的端到端任务。
2026-02-27 11:36:04
373
原创 Nano Banana 2 来了
Google 刚刚推出了 Nano Banana 2,如果你对 AI 图像工具感兴趣,这是一个重磅消息。它基本上是他们最新的模型,将高端质量与超快的生成速度结合起来。我一直在研究它的运作原理,很明显它的设计目的是让每个人——从普通用户到专业人士——都能更轻松地创建视觉内容。让我们一步步来拆解,看看它是否值得尝试。
2026-02-27 11:34:46
383
原创 当构建成本为零,什么值得构建?
在 2023 年,一项对照研究发现,使用 GitHub Copilot 的开发人员完成任务的速度比不使用的开发人员。这意味着你的 4 周冲刺变成了 2 周冲刺。到 2025 年,拥有 95% AI 生成的代码库。柯林斯词典将"vibe coding"命名为其。达到了 49.1 亿美元。大家都在庆祝软件的民主化。这是理所当然的。移除限制,你不仅能得到更快的软件。你还能得到更多软件。问题是更多是否更好——还是仅仅更多。
2026-02-27 11:33:36
266
原创 MCP 版本 2
我们正在探索 MCP Python SDK v2 的预 alpha 版本,重点关注将流行的FastMCP类替换为新的McpServer类。这只是作为示例引导开发者了解此次迁移的一个变更。此次迁移还包括其他几项变更!为了演示这一点,我们将构建一个终端服务器,允许 Claude Desktop 在指定的本地工作区内安全地执行 shell 命令。
2026-02-27 11:32:18
368
原创 AI创新者的困境
我目前正在构建一个,当事件被声明时,它可以自动调试和分类生产问题。我们是"代理SRE"空间的许多新进入者之一。在这里工作让我对AI生态系统的竞争动态有了第一手的观察,我越来越将其视为创新者困境的放大版。这个困境描述了成功的公司如何因为听从客户并投资于承诺最高回报的项目而失败。这种理性行为使它们容易受到较小公司的攻击,这些公司最初服务于利润较低的小型市场,但最终发展成威胁现有企业的核心业务。在今天的AI环境中,这种动态被极大加强。
2026-02-26 23:14:21
392
原创 氛围编程做产品的3个启示
目前AI中最有价值的不是代码、Nvidia GPU或计算机科学学位。而是你可能已经拥有的东西——而且大多数构建AI产品的人甚至不知道它的存在。一位律师、一位心脏病学家和一位来自乌干达的道路技术员。他们都没有软件背景。他们都在不到一周的时间内构建了受到数千人喜爱的成功AI产品。如果他们能做到,你也能。我的意思是字面意思——因为这三人获胜的原因是一样的,而你现在可能正坐在上面。你只是还不知道它是什么。让我们稍微回顾一下……上周,。他们想看看人们在一周内会用他们的最新模型构建什么。
2026-02-26 23:10:41
378
原创 OpenClaw的特别之处
我们需要更多这样的AI封装器来弥合当前的采用差距。不幸的是,尚未建立AI封装器应用程序的明确定义。这是我对AI封装器的定义。欢迎在评论中分享您的定义。AI封装器是构建在一个或多个基础模型之上的软件应用程序。它们结合并构建现有的AI技术,以便在特定生活情况或行业中为特定任务范围提供卓越服务。尽管AI领域几乎只谈论LLM和vLLM;但如果有更传统的深度和机器学习方法也能很好地完成工作,也不应被忽视。这种AI封装器应用程序的巨大优势与许多软件产品相同。
2026-02-26 15:09:40
422
原创 我用Claude Code提取航班数据
在使用任何工具之前,我想象了手动版本会涉及什么。打开每封邮件。找到出发航班日期。找到返回日期。记下目的地。将往返航程配对,这些有时在同一个预订中,有时不在。计算缺席天数,记住出发和返回日期不算,只计算中间的完整天数。将其记录到电子表格中。重复。对于一个充满预订确认邮件的收件箱,每封邮件一两分钟,很容易累积一个多小时或更长时间的细致、容易出错的工作。认知负荷不仅仅是时间,它是为了避免配对错误的航班或转置日期所需的持续注意力。这是一种单次分心就意味着重新开始的任务。可行。但这并不是我想花费晚上的方式。
2026-02-26 14:47:24
336
原创 OpenCode: Claude Code开源平替
Claude Code和OpenCode都成功完成了多文件重构并保留了应用程序行为。Claude Code遵循了结构化的、循序渐进的方法,具有明确的规划和检查,在整个过程中优先考虑安全性和正确性。OpenCode以更连续的执行流程完成了重构,依赖于通过导入和运行时检查进行直接验证。虽然两者都产生了正确的结果,但差异主要在于工作流程风格:Claude Code强调了谨慎执行,而OpenCode强调了控制和更改后验证。
2026-02-26 14:47:08
318
原创 真相:精英受AI冲击最大
620亿美元,五周内蒸发。并非源于经济衰退。不是因为丑闻。也不是某家公司犯了灾难性错误。拉里·埃里森自1月以来损失了近400亿美元。史蒂夫·鲍尔默眼睁睁看着290亿美元从他的净资产中蒸发。杰夫·贝索斯、AppLovin联合创始人、Workday联合创始人——所有人都在承受大多数人一生中读过的最大财务事件级别的损失。而市场并没有恐慌。它在调整。这两者有区别。市场目前逐步计入的是经济史上最具影响力的转变之一:战略智力——在房间里比其他人都思考得更快、更广泛的能力——正在变成商品。对每个人都触手可及。
2026-02-26 14:43:45
372
原创 真相:精英受AI冲击最大
620亿美元,五周内蒸发。并非源于经济衰退。不是因为丑闻。也不是某家公司犯了灾难性错误。拉里·埃里森自1月以来损失了近400亿美元。史蒂夫·鲍尔默眼睁睁看着290亿美元从他的净资产中蒸发。杰夫·贝索斯、AppLovin联合创始人、Workday联合创始人——所有人都在承受大多数人一生中读过的最大财务事件级别的损失。而市场并没有恐慌。它在调整。这两者有区别。市场目前逐步计入的是经济史上最具影响力的转变之一:战略智力——在房间里比其他人都思考得更快、更广泛的能力——正在变成商品。对每个人都触手可及。
2026-02-26 14:37:44
356
原创 AI代理如何排序内容
在某个时刻,每个代理都必须做出选择。想象一个企业代理被投入到一个混乱的现实:成千上万的文档、少量的API、半记住的过去对话,以及一个模糊的指令,比如"弄清楚上个季度出了什么问题。"它无法阅读所有内容。它无法做所有事情。它必须决定现在什么重要。那个安静的、不可见的、几乎从未被记录的决定就是内容排序。不是SEO那种。不是谷歌结果页面那种。是某种更微妙、也更加重要的东西。
2026-02-25 17:41:03
1054
原创 让Claude Code使用MiniMax API
像许多开发者一样,我喜欢动手测试最新的AI发展。Claude Code和OpenClaw取得了惊人的突破。从Vibe编码到24/7个人助手,AI Agent和LLM将使人类在不久的将来实现更多。
2026-02-25 17:40:28
994
原创 主流CAD将出现的3个AI功能
由于假期低迷期,软件新闻并不多,所以今天我想讨论一些你最近不太常听到的事情:AI。具体来说,CAD中的AI。在过去一两年中,我们看到每个主要CAD程序都在尝试AI功能。有些只是概念验证,有些是可测试的测试版,少数甚至已经进入了发布版本。我认为可以肯定地说,我们今年可以期待更多的AI功能发布。以下是我认为可能在2026年出现在每个主要CAD程序中的三个功能。
2026-02-25 17:39:33
939
原创 基于图的 Agent 记忆
LLM 驱动的 AI 代理可以生成代码、保持对话和做出决策。然而,由于上下文窗口限制,它们难以在随时间推移保留和利用过去的经验。基于图的记忆是这个问题的引人注目的答案。它将实体及其关系表示为节点和边,保留了扁平文本检索丢失的因果链和时间上下文。本文主要基于调查论文"基于图的代理记忆调查"(arXiv:2602.05665),并辅以两个具体架构:MAGMA (arXiv:2601.03236) 和 DeepImageSearch (arXiv:2602.10809)。
2026-02-25 11:43:33
663
原创 5个BIM建筑师必备的AI工具
BIM 建筑师的角色已经发生了转变。在 2026 年,问题不再是是否应该使用 AI,而是如何在不干扰建筑信息建模所需精度的情况下集成它。当今最有效的工具并不是试图取代建筑师;相反,它们自动化摩擦点 - 可视化、文档编制、场地分析和可行性 - 允许 BIM 模型保持单一事实来源。本指南评估了五种成熟的 AI 工具,它们自然地融入专业 BIM 工作流程,从实验性技术转向可靠的日常驱动程序。
2026-02-25 11:42:36
286
原创 Ollama视觉模型实测
我简单地拍了几张营养标签的照片,并使用提示转换为 JSON。然后我针对一堆自托管模型和 Mistral Open API 进行了测试。它们都表现得相当好,但 Mistral API 是最好的。你知道,击败基准测试是一回事。但基准测试通常是自我报告的随机变量,就像驾照考试和驾驶并不完全一样,它们不能保证给定的现实生活问题会以可行的方式解决。这就是为什么我想给它一个真实的测试用例。视觉模型在将其转换为 JPEG 方面有多好?
2026-02-25 11:05:37
359
原创 用AI自动标准化CAD 图层标准化
在建筑和工程办公室中,最重复且容易出错的任务之一是标准化 AutoCAD 图纸。每个顾问和分包商都使用自己的命名图层的约定。结构顾问可能使用SLAB_GF,而另一个可能使用FLOOR_1。在团队能够生成数量、协调模型或提取有意义的数据之前,所有图层必须组织成一组一致的类别。手动执行此操作既耗时又有错误风险。更好的方法是结合自动化和人工智能。
2026-02-25 11:04:37
339
原创 3个免费用Claude Code的方法
每个人都认为 Claude Code 需要 Anthropic 订阅。并不是。我在花了 20 分钟试图向自己证明每月 20 美元的计划是合理的时候才发现这一点。然后我深入钻研,在 Panaversity AI Agent Factory 文档中找到了实际设置,并在 10 分钟内让它免费运行起来。它只是与你指向的任何 URL 对话。所以如果你指向一个免费模型 —— Gemini、DeepSeek 或 OpenRouter 上 30 多个模型中的任何一个 —— 它的运作方式完全相同。
2026-02-25 11:04:03
487
原创 编程已死?No!
我有两条消息要告诉你:一条好消息,一条坏消息。坏消息:在 LLM 之上构建 AGI 是不可能的。好消息:如果你是高认知领域的专家,你可能不会被解雇。除非 Sam Altman、Dario Amodei 和 Demis Hassabis 已经用 AI 将取代每个工人的高谈阔论影响了你的老板。我一直听到同样的老调:当前一代的模型创造了奇迹。你让它构建某个应用程序,按下"Enter",然后去喝杯咖啡。当你回来时,一切都完成了并且正常工作。一如既往 —— 极其夸大其词。有时 —— 完全虚构。
2026-02-25 11:03:29
330
原创 Sonnet 4.6 vs Opus 4.6
模型发布速度如此之快,以至于很难区分什么是真正的进步与仅仅是增量收益。随着 Sonnet 4.6 的发布,我决定进行一些正面测试,将其与 Opus 4.6 进行比较。AI 实验室发布的基准测试正变得越来越不可靠,所以我运行了一些简单的测试提示,在中。
2026-02-24 18:14:52
432
原创 在Reddit上探索未满足的需求
模型会提取你手动阅读会错过的主题:以五种不同方式表述的相同投诉、人们不直接陈述的隐含需求、埋藏在随意评论中关于价格敏感性的信号。
2026-02-24 18:13:57
243
原创 Deep Blue:软件工程师的新情绪
开发者现在对自己所感受到的情绪有了名字。它被称为 Deep Blue。Simon Willison是 Django 的共同创造者之一,Django 是世界上最广泛使用的 Web 框架之一。过去几年,他一直在构建 Datasette,这是一个帮助记者和研究人员理解混乱数据的开源工具包。有一次,他将一份包含数十万行的旧金山警方事件报告 CSV 文件上传到了 ChatGPT 的代码解释器中。他输入了几个提示。它完成了他在接下来几年路线图上的所有数据清理和分析工作。"我记得当时脑子里同时有两个对立的想法,"Will
2026-02-24 18:12:43
330
原创 2028年全球智能危机
如果我们的 AI 看涨观点继续是正确的……如果这实际上是看跌的呢?**以下是场景,不是预测。**这不是看空AI 末日迷情小说。这篇文章的唯一目的是对一个相对未被充分探索的场景进行建模。我们的朋友 Alap Shah 提出了问题,我们一起头脑风暴了答案。我们写了这一部分,他还写了另外两部分,你可以在这里。希望阅读本文能让你更好地应对 AI 使经济越来越怪异时的潜在左尾风险。
2026-02-24 08:12:34
1129
原创 腐蚀任何AI只需要几百份恶意文档
Anthropic 的文章是一个警告:在未来的世界里,我能否信任给定模型所说的问题,不会由准确度指标来回答,而是一个更令人不安的问题:“我能信任它是如何制造的、它是在什么数据上训练的,以及谁处理了那些数据?因为如果我们接受一个模型可以用不透明的数据、模糊的来源和不完美的控制进行训练,并且一个耐心的攻击者可以植入几十或几百个设计用于在此过程中幸存的片段,那么模型就不再仅仅是概率性的,而是潜在被掺假的。我们谈论的是可验证的来源、可重现的策展过程、训练过程中的异常监测、设计用于检测条件行为的测试、持续。
2026-02-24 08:09:32
512
原创 软件工程师:手艺并不是核心
上周,我发布了一个功能,本来会让我花三天时间来编码。花了我大约一小时。不是因为我发现了一些捷径或使用了更好的框架。我没有写一行代码。我描述了我想要的,将其分解为并行任务,并观看四个 AI 会话同时构建它,而我审查、重定向和改进。到结束时,功能已经上线。它工作。而且老实说,感觉很好。我知道结果应该是什么,我清楚地描述了它,结果也匹配了。当它点击时,有一种令人满足的感觉。但满足感之下还有一种更难命名的感觉。不是不适,更像是你与你自己构建的东西的关系方式的安静转变。你设想了它,你指导了它,你验证了它。
2026-02-24 03:27:27
261
原创 OpenClaw:开启AI员工元年
我也讨厌"改变一切"这个短语。但这一个确实感觉像这样。至少它在我身上生根了。但我需要先把一些事情说清楚。OpenAI 没有"购买"OpenClaw。我在过去一周里看到这个标题在、X 和每个 AI 时事通讯上循环。发布说加入 OpenAI "推动下一代个人代理。"几个小时内,互联网决定这是一个。不是。OpenClaw 是。你MIT 许可的软件。OpenAI 购买的是 100% 的维护者访问权和他的合作。他们,而不是项目。如果他们处理不当,社区。他们不拥有它——他们只是对它有更好的访问权。
2026-02-24 03:25:45
649
原创 OpenCode vs Claude Code
大多数 OpenCode 和 Claude Code 之间的比较都错过了重点。讨论通常集中在哪个工具写更清晰的代码,哪个更快,或者哪个终端体验感觉更好。这些是表面层面的差异。真正的差异在下面。Claude Code 是一个紧密集成的系统。它提供精心策划的体验,具有强大的默认值、原生订阅支持和可预测的行为。一切都在单个生态系统中工作。OpenCode 采取了根本不同的路径。它将代理与模型层解耦。它将编码代理视为基础设施而不是产品。提供商可以交换。可以使用本地模型。工具注入可以被限定。配置成为首要关注点。
2026-02-24 03:24:00
314
原创 编程问题已解决
目前大多数 AI 辅助开发缺乏雄心。我们从小处着手。一次只添加一个功能。我们跳过困难的部分。我们构建玩具项目来"试水"。我们将 AI 视为一个不完全信任的实习生,交给它一些安全的小任务,同时保护真正的架构免受其影响。我们向客户承诺一个 MVP,而不仅仅是 P。我就是这样做的。然后我意识到问题不在工具,而在于我。我仍然像必须自己完成工作一样规划项目,将范围限制在一个合理时间内一个人可以完成的范围内。模型已经进步了,但我的雄心没有。所以我停止了小规模建设。开始梦想非常非常大的东西。
2026-02-24 03:22:58
982
原创 “上下文“是你所需要的全部
RAG 管道。智能体工作流。微调模型。向量存储。编排层。语义层。知识图谱。每个月都有一个新模式被命名。每个季度都有一个新框架承诺要解决所有其他框架之间的协调问题。在每次事后分析中,在每次失败演示后的走廊谈话中,都会出现同样的问题:为什么不起作用?能够最快应对这种复杂性的团队并不一定是拥有最大预算或最复杂模型的团队。他们是那些为技术栈的每一部分的实际功能建立了清晰心智模型的团队——以及这些部分如何连接。代码智能体类别最清楚地说明了这一点。
2026-02-24 03:21:16
282
原创 轻量AI助手的兴起
PicoClaw和nanoBot通过证明强大的个人助手不需要庞大硬件或无限资源,已经吸引了开发者和AI爱好者的同样关注。这些项目展示了我们在为现实世界约束优化AI代理方面取得了多大进展,使先进的自动化在成本低于一杯咖啡的设备上变得可访问。
2026-02-23 18:10:20
816
原创 AI系统工程的六大核心技能
蒸汽机重新定义了制造业。电力重新定义了规模。互联网重新定义了获取方式。每一次革命不仅改变了我们建造的东西——更改变了我们需要成为什么样的人来建造它。AI是最新的一波浪潮,而且它比以往任何时候都来得更快。那些将蓬勃发展的工程师不会是那些固守去年掌握的工具的人。他们是那些能够适应的人——那些学会协调思考而非仅仅编写代码的人;那些为自主智能体设计信任边界而非手工调试循环的人。本文是适应这份地图:六项核心技能,将驾驭这波浪潮的工程师与那些仍在岸边观望的人区分开来。
2026-02-23 16:55:08
943
原创 Wellows:生成式AI搜索优化平台
今天,越来越多的人在网上搜索东西时使用 AI 聊天机器人,而不是"谷歌一下"。超过 30% 的 Z 世代和千禧一代用户现在更喜欢使用 ChatGPT、Gemini、Perplexity 和 Google AI 概览等 AI 工具进行研究 和决策,而不是传统的搜索引擎。这不是典型的 SEO。人们称之为生成引擎优化,或简称为 GEO。GEO 是构建在线内容结构,使其能够被 AI 驱动的搜索引擎发现、引用和推荐的过程。与推动网站点击的传统 SEO 不同,GEO 专注于对话式 AI 答案中的品牌可见性和权威性。
2026-02-23 15:01:50
981
区块链论文精选合集-2.pdf
2020-04-15
区块链论文精选合集-1.pdf
2020-02-19
Fabric Java SDK 1.4 快速入门
2019-04-23
EOS RPC中文手册
2018-12-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅