- 博客(1538)
- 资源 (23)
- 收藏
- 关注
原创 估算加载模型所需的GPU 内存
在上一篇文章中,我们讨论了在 pytorch 中使用 GPU 的基础知识。在本文中,我们将理解如何估算给定模型需要多少 GPU 内存。这将帮助我们根据模型估算使用哪个 GPU,或者根据 GPU 估算使用哪个模型。这还将帮助我们防止 OOM(cuda out of memory 错误),当 GPU RAM 上没有可用内存时会发生这种错误。
2026-03-25 12:12:24
61
原创 为数据分析管道增加编排层
多年来,仪表板一直是与数据交互的主要界面。它们呈现指标、可视化趋势,并通过图表和过滤器支持决策。但它们也要求用户解释结果、提出后续问题并手动调查根本原因。如果这个调查层可以由系统驱动呢?这就是编排变得关键的地方。Agentic AI 系统通常以 tool calling 或大语言模型来描述。然而在实践中,决定性的转变不是工具本身——而是增加了一个编排层,它可以协调这些工具、决定下一步做什么,并迭代优化响应。
2026-03-25 12:11:42
94
原创 追踪来自Agent的Web 流量
在最近与同事们分享了关于 Agent 如何使用文档的发现后,最先被问到的问题之一(来自多人!)是:我们如何度量这些问题的影响?
2026-03-25 12:00:39
208
原创 为 GraphRAG 准备语料库
经典 RAG 专注于找到正确的段落,而 GraphRAG 帮助你看到段落、实体和主题在整个文档集合中是如何连接的。原始 GraphRAG 论文指出,标准 RAG 常常在处理宽泛问题时遇到困难,比如"这个数据集中的主要主题是什么?"为了解决这个问题,GraphRAG 从你的文档创建实体图并生成其中各组的摘要。这意味着你的语料库质量同时影响检索和图的结构。在处理分块器或嵌入模型之前,先决定你的系统需要回答哪些类型的问题。
2026-03-25 11:57:56
165
原创 用 Google Stitch 重构设计系统
Google Stitch 之所以有趣,不是因为它用 AI 画屏幕,而是因为它将设计视为结构化、可编程的数据。这是整个行业正在移动的方向。对于工程师来说,要点很简单。设计系统正在变成 API,而 AI 是主要的客户端。如果你以模型能理解的方式暴露你的组件、token 和流程,你会获得杠杆。更快的迭代、更好的一致性,以及更少的手动在设计和代码之间的翻译。如果你把一切都锁定在不透明的 Figma 文件和部落知识中,AI 将主要生成噪音。Stitch 是推动你清理这些的助推器。
2026-03-25 11:57:38
186
原创 Channels: 用手机访问Claude Code
如果你可以从手机给你的 AI 编码 Agent 发消息,让它在你的电脑上构建东西——即使你不在办公桌前呢?Claude Code Channels 配合 Telegram 做的正是这件事。在本指南中,我将带你完成设置一个 Telegram 机器人,它直接连接到 Claude Code。你发送一条消息,Claude 完成工作,然后将结果直接发回你的 Telegram——包括它构建内容的截图。如果你看过我之前的 Discord 版本设置,这是 Telegram 的配套版本。概念相同,只是消息平台不同。
2026-03-25 11:55:46
240
原创 AI工程师成长路线图 (2026)
大多数有抱负的 AI 工程师浪费了几个月的时间,以错误的顺序学习错误的内容。他们从一门四十小时的深度学习课程开始,花几周时间试图理解反向传播背后的微积分,读无休止的争论——关于哪个向量数据库是绝对最快的。然后他们尝试构建一个简单的应用程序,就愣住了。他们不知道如何处理 API 超时,不知道如何强制模型输出有效的 JSON。他们在 Jupyter notebook 中构建了一个聊天机器人演示,但不知道如何把它放到真正的服务器上。
2026-03-25 11:55:34
226
原创 NemoClaw 新手指南
让我们直接开始吧!这是一个开源的 AI Agent 平台,旨在为企业提供安全、可控且高效的环境来部署 AI Agent。
2026-03-25 11:49:05
86
原创 12个最佳AI演示文稿(PPT)制作工具
过去几个月,AI驱动的演示文稿生成器获得了显著关注,专业人士寻找更快的方式来构建幻灯片,无需花费数小时格式化布局或在PPT或Google Slides上手动拖放形状。用户现在可以从空白幻灯片开始,在几秒钟内从简短提示、大纲或文档生成结构化演示文稿。Google、Anthropic和OpenAI等公司的平台已经在其AI聊天应用中引入了幻灯片生成功能,允许用户快速将想法转化为演示文稿草稿。随着这种快速增长,网上可用的AI演示工具数量也急剧扩展。
2026-03-24 23:41:49
257
原创 20个Nano Banana 2创意工作流
你可能已经生成过一些AI图像了。也许是头像、Logo概念,或者穿着太空服的奇怪猫咪。但如果我告诉你有一个图像模型可以让你在单一对话式API中生成、编辑、合成多张图像、渲染可读文本,甚至通过实时网络搜索验证其输出呢?这个模型就是Nano Banana 2,Google为其Gemini原生图像生成能力的公开名称,它正在悄悄成为开发者可用的最具生产就绪性的创意工具之一。什么是Nano Banana 2,为什么你应该关注?Nano Banana是Gemini原生图像生成的总称。
2026-03-24 23:41:13
320
原创 AI时代好的设计意味着什么
我将这篇文章作为多伦多大学继续教育学院:用户体验(UX)设计导论——第一部分的最终作业撰写。我很高兴分享这篇文章获得了最高分,并得到了讲师的积极反馈。我在这里发布它,以将对话延伸到课堂之外。
2026-03-24 23:39:18
232
原创 如何合法地逆向SynthID
你知道当你让Nano Banana生成图片时,右下角有个小钻石标志吗?讨厌这个东西虽然很烦,但你可以直接裁剪掉。会破坏图片比例,不过是最简单的方法。有人想出了一个来不裁剪直接去除它,你可能以为就没事了。Gemini仍然会标记它为AI生成的。为什么?因为Gemini增加了一层额外的安全保护——SynthID,这是由开发的技术,能在AI生成的内容中嵌入不可察觉的数字水印——包括图像、音频、视频和文本——以识别其合成来源。
2026-03-24 23:38:12
350
原创 用LLM训练LLM的3个方法
"LLM训练其他LLM"这个标题听起来像营销。下面的现实更有趣也更有用。我们正在悄悄地从以人类为中心的监督转向以模型为中心的监督。我们正在构建训练流水线,其中模型生成、评判和优化训练其他模型的数据。与此同时,硬件和软件栈只是勉强为非超大规模团队提供70B级别的模型支持。如果你理解分布式训练并能保持集群运行,你就有杠杆。在视觉领域,故事不同。进展是真实的,但它不像文本那样统一或通用。如果你是工程师,机会是明确的。学习如何连接模型,而不仅仅是调用它们。
2026-03-23 23:42:46
288
原创 NotebookLM:最佳学习工具
NotebookLM是我最喜欢的工具之一。这是一个基于你自己文档的AI工具,在2026年学习新科目时可以为你节省数百小时。我经常使用它。它非常易于使用、效果极佳,而且免费。与大多数AI工具不同,NotebookLM只使用你提供的数据。你可以向它输入:Google Docs、YouTube视频、网站、PDF、文本、音频、Word文档等等!这意味着:响应不会产生幻觉、对来源有完全控制权、结果更准确且可验证(它提供行内引用)
2026-03-23 22:43:12
327
原创 AI智能体五大设计模式
AI智能体是为实现特定目标而设计的软件系统。与遵循固定脚本的基于规则的自动化软件不同,AI智能体将LLM的强大功能与额外能力相结合,能够更独立地工作并处理复杂的多步骤问题。可以将AI智能体视为一个以目标为导向的系统,它决定下一步做什么、采取行动并不断适应。当给定一个目标或任务(通常基于用户查询)时,AI智能体可以使用LLM和外部工具来创建最终响应。图片由[1]提供我们使用"智能体"(agentic)这个术语是因为这些系统可以以不同程度的自主性运行。
2026-03-23 22:42:50
381
原创 Codewatch: 实时代码审查AI工具
我花了很多时间进行"氛围编码"。像许多开发者一样,我不断在Claude Code、Cursor和其他AI编码工具之间切换。质量在不断提高,新功能每天都在涌现。技能、MCP、agents.md以及无数技术帮助我更快地编码。我发现自己花大量时间审查AI生成的代码,老实说,有时我只是相信并希望Claude在做正确的事情。让我给你一个真实的例子。作为开发者,这应该是自动的。然而,我不断发现Claude在我的项目中正是这样做的。即使是Claude本身,如果我不小心,也会硬编码API密钥。
2026-03-23 22:33:52
400
原创 时序正则化正在革新AI世界模型
当我们思考人类如何在世界中导航时,我们看到的不仅仅是一系列随机的快照。相反,我们的大脑有一种不可思议的能力,能够将杂乱、复杂的视觉信息转化为流畅、可预测的心理地图。在AI领域,研究人员正试图通过赋予机器同样的能力。世界模型本质上是AI的内部模拟器,让它能够在实际采取行动之前想象行动的后果。然而,一直存在一个持续的问题:AI在其内心世界中观察世界的方式往往极其扭曲。来自纽约大学和其他顶级机构专家的最新研究提出了一种受人类生物学启发的解决方案,称为。
2026-03-23 22:32:32
360
原创 Okara AI CMO:市场营销智能体
编写代码现在已经成为创业过程中最容易的部分。Okara刚发布了一个自主代理,专门解决最难的那部分:让别人真正关注你的产品今天早上,我在查看我的UFC预测平台的部署日志时,意识到一件令人沮丧的事情。过去,编写架构是推出产品的主要障碍。但现在,有了Cursor和Claude Code CLI这样的工具,我可以在几周内就构建出一个功能完整的后端。但让别人真正去看看它呢?这才是真正的瓶颈。昨天,Okara推出了一款专门解决这个问题的产品。
2026-03-22 07:33:16
302
原创 6个月成为AI工程师(含资源)
AI工程已迅速成为科技领域最有价值的技能之一。问题在于,大多数初学者并不清楚自己究竟应该学习什么。有些人从机器学习理论入手。有些人则陷入无休止的教程观看中。还有一些人直接跳到提示和代理上,却不了解API、后端基础知识,也不了解实际产品是如何构建的。结果通常都是一样的:一片混乱,却几乎没有任何实践技能。如果你的目标是成为一名AI工程师,你不需要精通人工智能的每一个领域。你需要学习如何在现实世界中构建有用的AI系统。这篇文章超过 10,000 字,所以阅读可能需要几个小时甚至更长时间。
2026-03-22 07:30:39
1144
原创 本地优先的AI技术栈
每个月,数百万开发者和创作者为AI订阅支付20到200美元。ChatGPT Plus。Claude Pro。Copilot。API积分消耗得比预期快得多。以下是大多数人没有意识到的:你可以在自己的机器上免费构建完整的AI设置。私密。快速。不需要互联网。没有速率限制。没有一夜之间破坏你工作流的服务条款变更。2026年的开源AI生态系统已经足够成熟,可以在大多数日常任务中替代云AI。模型具有竞争力。工具精良。唯一缺少的是将它们组合在一起的清晰指南。这就是那个指南。七个工具。零美元。从硬件检查到日常使用的完整本地
2026-03-22 07:28:31
283
原创 Unsloth Studio:一键微调LLM
在本地运行和微调AI模型一直很强大,但很少简单。大多数开发者仍然需要处理脚本、配置和多个工具才能让基本的管道工作。这种摩擦正是试图消除的。Unsloth Studio将使用开源模型的整个生命周期带入一个本地界面。从加载模型到创建数据集、训练、评估和导出,一切都发生在一个Web UI中。
2026-03-21 20:55:11
49
原创 Mau Baron:如何实现$25K MRR
我们正经历着一生中最大的机遇,可以通过移动应用创造世代财富。人工智能让任何人都能在几天内开发出一款应用。准入门槛从未如此之低,市场也从未如此之大。人们利用周末开发的简单应用,每月就能赚到 2 万美元、5 万美元甚至 10 万美元。但你们中的大多数人将会错过这波浪潮。不是因为你们不够聪明,也不是因为你们不会开发,而是因为开发应用变得容易了,但分发应用却并没有。所以,我将把完整的操作指南分享给大家。如何选择合适的应用,如何获得你的第一批用户,如何打造完美的付费用户引导流程,如何扩展你的分发渠道,等等。
2026-03-21 20:50:13
292
原创 leboncoin:微调如何击败RAG
在leboncoin——法国最大的分类广告平台,我们每天帮助数百万用户出售他们的物品。广告发布是我们市场的核心,这是供应进入平台的关键时刻。当有人列出一部iPhone出售时,我们会要求他们填写属性:品牌、型号、存储和颜色。这些属性驱动搜索过滤器,帮助买家找到他们想要的东西。挑战是什么?填写所有这些字段需要时间。这就是认知团队的用武之地。我们是一个专注于通过构建ML和GenAI驱动的服务来使广告创建更快、更顺畅的产品和ML团队,以减少卖家工作量并提高广告质量。
2026-03-21 20:49:58
127
原创 12个NumPy实用小技巧
NumPy现在是ETL、特征工程和机器学习之间的粘合剂。然而大多数工程师仍然使用缓慢的循环、隐式转换和不一致的预处理来构建流水线。这是2026年的现代NumPy流水线手册:快速、稳定、向量化且可用于生产。
2026-03-21 20:46:32
137
原创 AI模型微调速查手册
在收集数据之前,精确定义模型将接收什么输入以及应该产生什么输出。任务输入预期输出客户支持客户消息+上下文支持响应内容分类文章文本类别标签+置信度产品描述产品规格+关键词营销描述数据提取非结构化文本结构化JSON邮件起草邮件上下文+意图草稿邮件。
2026-03-21 20:46:20
368
原创 Autoresearch 代码深度解析
MAX_SEQ_LEN = 2048 # 上下文长度TIME_BUDGET = 300 # 训练时间预算(秒)(5 分钟)EVAL_TOKENS = 40 * 524288 # 验证评估的 token 数量这三个数字定义了整个实验方案。:上下文窗口。代理创建的每个模型变体都必须在这个固定序列长度内运行,确保公平比较。:5 分钟的壁钟预算是 autoresearch 中最重要的设计决策。它使实验依赖于硬件但独立于时间。
2026-03-21 20:42:04
304
原创 修复Vibe Coding应用的廉价感
你可以在 3 秒内识别出一个 Vibe Coding的应用。不是因为代码写得不好,而是因为设计决策有问题。字体错误。间距不一致。颜色搭配不协调。组件看起来像 shadcn 但又略有偏差。这些问题修复起来并不费时,但你必须知道该检查什么。
2026-03-21 20:41:40
288
原创 如何在AI时代保持不可替代
首先,转变你的思维模式。其次,提升人工智能技能。第三(也是最重要的),你需要培养真正能让你在市场竞争中脱颖而出的个人技能。做到这三点,你几乎就无可替代了。这一切并不复杂,但确实需要你诚实面对自己,并努力提升你目前薄弱的技能领域。这就是筛选标准。大多数人读完这篇文章后,会受到激励二十分钟,然后什么也不做。而那些付诸行动的人,会将这篇文章视为改变他们人生轨迹的转折点。如何在AI时代保持不可替代 - 汇智网。
2026-03-21 20:31:56
204
原创 Google Stitch 新手教程
快速创意迭代是 2026 年最重要的月份。Stitch 将这种快速迭代功能称为“变体”。变体功能允许你生成五个设计方案并从中选出优胜方案,或者组合强大的素材。大多数设计师已经这样做了:他们花费 6-8 个小时创建同一内容的多个版本,然后与利益相关者进行压力测试。Stitch 将这个过程缩短到 5 分钟。
2026-03-21 20:31:44
564
1
原创 mflux:Mac本地生图AI工具
图片生成技术持续快速进步。目前,Google 的 Nano Banana(目前是第二版)通常被认为是领先的模型。当第一个 Nano Banana 模型发布时,它因出色的指令遵循能力和准确的文字生成能力而脱颖而出。这是因为文字一直是早期模型的长期弱点,而 Nano Banana 开辟了许多实际应用场景,比如从数据动态创建图表。但 Google 并非这个领域的唯一玩家。Black Forest Labs 是一家德国公司,以更少的资源取得了出色的成绩。
2026-03-21 20:29:11
498
原创 5个OpenClaw可用的免费AI模型
我曾担心 Anthropic 会因为我在 OpenClaw 中运行 Claude 而封禁我的账户。我另一个担心的是成本。每天在 OpenClaw 上运行 Claude Sonnet 的消耗超出了我的预期。每条消息都会将完整的对话历史发送给模型。所以我开始寻找免费的替代方案。有些模型可以在本地运行。有些使用免费云层,足够完成工作。我学到了——"免费"根据你选择的路线有不同含义。本地模型每个 token 不花钱,但需要不错的硬件。云免费层给你一个每日重置的配额。有些模型非常便宜,四舍五入后接近零。
2026-03-20 21:33:24
177
原创 Perplexity+NotebookLM=天才
每个人都在使用的工具组合,几乎没有人做对的架构——以及它悄悄腐蚀你研究的三种方式,而你却没有注意到我花了一个完整季度才相信我破解了研究。我的Perplexity标签页总是打开的,我的NotebookLM笔记本井井有条,我在不到一小时内就能生成以前需要两天的客户交付物。然后一个客户打电话指出,我宣布"正在衰退"的竞争对手刚刚完成了4000万美元的B轮融资。数据没有错。架构错了。我将Perplexity摘要直接输入NotebookLM,它自信而完整地进行了综合,而我从未接触过主要来源。
2026-03-20 21:32:59
130
原创 用 autoresearch 优化万物
其他扩展autoresearch的人都分支了仓库。这将工具锁定在一个平台和一个领域。我将此构建为AgentSkills规范中的技能,因为技能可以组合。该技能与Claude Code原生配合,并可转换为其他10种工具——Codex CLI、Gemini CLI、Cursor、Windsurf、OpenClaw、Aider、Kilo Code、OpenCode、Augment和Antigravity。一个架构,十一个平台。这也意味着autoresearch-agent技能可以与生态系统中的其他技能组合。
2026-03-20 21:17:32
142
原创 Superpowers 软件工程插件
Superpowers是Jesse Vincent创建的开源插件,将AI编码代理从被动代码生成器转变为有纪律的工程伙伴。通过六个可组合技能,包括强制头脑风暴、git worktree隔离、TDD强制和子代理驱动开发,它用结构化管道替代了氛围编码,产生经过测试、审查和可合并的代码。氛围编码产生的代码在演示中工作,在生产中崩溃。Superpowers添加了护栏,将AI聊天机器人转变为工程伙伴,它在编码前进行头脑风暴,在实现前编写测试,在合并前审查自己的工作。
2026-03-20 21:16:51
294
原创 10个最受欢迎的Claude插件
Claude刚刚获得了超能力。而大多数人仍然认为它只是一个聊天机器人。2026年2月24日,Anthropic为企业用户宣布了。两周前,社区发布了超过,将Claude的能力扩展到文本生成之外。结果?以下是你应该今天就安装的10个插件。
2026-03-20 21:16:37
348
原创 智能家居大脑:树莓派+Ollama
在本地运行大语言模型曾经意味着需要一台功耗很高的桌面 GPU,以及相当的耐心。借助 Raspberry Pi 5 和 Raspberry Pi AI HAT+ 2(Hailo-10H),这个门槛大大降低了。你可以构建一个紧凑、低功耗的系统,在你的桌面上——或者就我而言,在电视柜上——完全运行 LLM 推理。
2026-03-20 21:10:53
263
原创 产品设计师上下文工程指南
AI并不总是当你添加更多细节时会"更努力"。通常,情况相反——它往往会迷失。在处理复杂推理任务时,准确率高达70%。但许多设计师仍然把AI当作黑箱:倒入需求,期待魔法,不起作用时无休止地修正。,而在于没有给AI清晰思考所需的信息。作为设计师,我们理解信息结构化的方式直接影响人们处理它的方式。同样的原则适用于AI——只是AI对结构比人类更敏感。,AI变得可靠且真正协作。当你不这样做时,你本质上是在让某人解决一个拼图,同时隐藏了一半的碎片。
2026-03-20 21:10:37
284
原创 智能家居大脑:树莓派+Ollama
在本地运行大语言模型曾经意味着需要一台功耗很高的桌面 GPU,以及相当的耐心。借助 Raspberry Pi 5 和 Raspberry Pi AI HAT+ 2(Hailo-10H),这个门槛大大降低了。你可以构建一个紧凑、低功耗的系统,在你的桌面上——或者就我而言,在电视柜上——完全运行 LLM 推理。
2026-03-20 20:12:03
408
区块链论文精选合集-2.pdf
2020-04-15
区块链论文精选合集-1.pdf
2020-02-19
Fabric Java SDK 1.4 快速入门
2019-04-23
EOS RPC中文手册
2018-12-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅