李孟聊人工智能
独立开发,Substack和Medium顶级编辑
展开
-
AI编程: OpenAI Codex vs Google Jules vs GitHub Copilot++
2025年,AI编程助手领域迎来重大突破,微软、OpenAI和谷歌分别推出了Copilot++、Codex和Jules,这些工具已超越传统自动补全功能,成为真正的编程助手。它们能够理解任务、运行测试、提出拉取请求,并提供变更日志,极大地提升了开发效率。Codex在并行沙盒环境中运行,适合多任务开发者;Jules以音频优先的体验为特色,适合追求异步生产力的团队;Copilot++则通过GitHub Actions集成,优化了CI/CD工作流程。这些AI助手的出现,标志着编程方式的新变革,开发者可以根据需求选择原创 2025-05-22 21:55:53 · 283 阅读 · 0 评论 -
谷歌I/O 2025 完全指南:由Gemini开创的AI新时代及其对我们未来的影响
谷歌I/O 2025不仅仅是产品展示。原创 2025-05-21 21:03:47 · 84 阅读 · 0 评论 -
Manus AI 现已向所有人免费开放
Manus 是一款于2025年3月推出的AI聊天机器人,在短短七天内就有超过200万人加入等待名单。这个数字本身就说明了很多。当时,人们称之为又一个"DeepSeek时刻"。原创 2025-05-19 19:57:51 · 40 阅读 · 0 评论 -
OpenAI推出Codex — ChatGPT内置的软件工程Agents
OpenAI最近推出了Codex的研究预览版,这是其最强大的AI编码助手,专为开发者设计。Codex能够编写代码、修复错误、运行测试,并在安全的云环境中管理多个编码任务。它基于codex-1模型,通过强化学习训练,能够生成符合人类风格的代码,并准确执行指令。Codex目前仅支持通过GitHub仓库进行任务分配,且无法访问互联网,这限制了其环境设置能力。尽管存在这些限制,Codex被视为未来AI编码助手的先驱,有望改变软件开发的工作方式。目前,Codex仅对ChatGPT Pro、Enterprise和Tea原创 2025-05-18 20:43:45 · 506 阅读 · 0 评论 -
Canva 推出自有应用生成器以与 Bolt 和 Lovable 竞争
Canva,一个以图形设计闻名的平台,在其2025活动中推出了AI代码生成器,加入了AI市场的竞争。这一工具集成在Canva界面中,用户可以通过描述需求来生成代码,并实时预览应用程序。然而,初步使用体验显示,该工具生成代码速度慢,功能有限,且用户无法直接访问或编辑生成的代码,缺乏灵活性和版本控制。尽管Canva的目标是简化非开发者的应用程序创建过程,但当前版本显得不成熟,与市场上其他AI编码平台相比存在明显不足。Canva未来可能会整合其设计工具和代码生成器,以提供更全面的解决方案。原创 2025-05-17 23:22:34 · 350 阅读 · 0 评论 -
MGX:多智能体管理开发流程
MGX(MetaGPT X)通过其多智能体团队和专家混合系统,彻底改变了AI辅助开发流程。与当前专注于单一领域的工具不同,MGX采用团队式方法,管理整个开发生命周期,模拟创业公司内的角色分工。团队包括领导、产品经理、架构师、工程师和数据专家,他们协作处理复杂项目。用户只需提供简单提示,MGX团队即可从需求分析到部署,完成全栈开发。MGX不仅提供端到端开发支持,还通过多阶段审查确保高质量结果,展示了AI辅助工具的未来潜力。原创 2025-05-16 20:19:29 · 110 阅读 · 0 评论 -
Cursor vs VS Code vs Zed
代码编辑器的世界已经迎来了创新的爆发。曾经由重量级IDE或基础文本编辑器主导的领域,如今开发者们发现自己正在探索全新一波聚焦于AI集成、协作和性能的工具。在本文中,我们将深入探讨2025年三款流行的编辑器:Cursor、Visual Studio Code (VS Code)和Zed Code Editor。每一款都为开发体验带来了独特的方法——无论你是寻求AI驱动的编码、深度定制,还是闪电般快速的协作。原创 2025-05-15 21:03:29 · 83 阅读 · 0 评论 -
Cursor 0.5版本发布,新功能介绍
Cursor在v0.50版本中推出了多项新功能,旨在提升开发者的编程体验。主要更新包括:Max模式,提供更精细的上下文控制和基于tokens的定价系统;新的Tab模型,支持跨多文件的建议和更快的代码导航;后台代理,允许并行运行多个代理以处理更大任务;完整代码库上下文,通过@folders功能将整个代码库纳入上下文;更新的行内编辑,增加了完整文件编辑和代理交接功能;快速编辑工具,提升长文件处理效率;多根工作区,支持同时访问多个代码库。这些改进使Cursor在AI编程工具中保持领先地位,并展示了其持续创新的能力原创 2025-05-14 23:08:57 · 115 阅读 · 0 评论 -
InternVL3: 利用AI处理文本、图像、视频、OCR和数据分析
InternVL3 是一款突破性的视觉-语言模型,通过无缝集成视觉和语言处理,显著提升了多模态理解、推理和感知能力。它在图像-文本、视频-文本和纯文本数据的处理上表现出色,支持从1B到78B的多种参数规模,适应不同计算需求。InternVL3引入了可变视觉位置编码(V2PE)和原生多模态预训练,优化了OCR、工业图像分析、3D感知和GUI交互等复杂任务。用户可通过简单的安装步骤在Google Colab上快速体验其功能,适用于广泛的现实场景应用。原创 2025-05-13 20:41:19 · 219 阅读 · 0 评论 -
AugmentCode 非常昂贵的新定价
AugmentCode 近期大幅调整了其定价结构,月费从30美元涨至50美元,涨幅达67%,并删除了部分功能,如无限代理请求。原创 2025-05-11 22:51:08 · 302 阅读 · 0 评论 -
Vibe Coding: 优点与缺点
"氛围编程"(vibe coding)是开发圈中的新趋势,它通过AI辅助工具如Cursor实现快速迭代和实时反馈,显著提升开发效率。原创 2025-05-09 23:19:39 · 307 阅读 · 0 评论 -
Google 发布 Gemini 2.5 Pro Preview (I/O Edition),具有增强的编程能力
Google近日发布了其最新的AI模型Gemini 2.5 Pro Preview "I/O Edition",该模型在编程能力上进行了显著增强,特别是在网页开发领域表现突出。原创 2025-05-08 21:01:36 · 127 阅读 · 0 评论 -
OpenAI以30亿美元收购Windsurf(Codeium):对编程未来的押注
基本上,OpenAI想要自己的Copilot,自己的IDE原生工具,和自己的数据——不再是GitHub Copilot中沉默的合作伙伴,让微软获得荣誉(和遥测数据)。在可能成为其最大规模收购案的交易中,据报道,OpenAI正以惊人的30亿美元收购Windsurf,这是一款曾名为Codeium的AI驱动编码工具。但Windsurf是即插即用的AI强者,有了OpenAI的资源,它可能会比你输入"npm install"还快地从"酷工具"变成"行业标准"。这不仅仅是一笔商业交易——这是向软件开发未来的大胆飞跃。原创 2025-05-07 20:24:10 · 29 阅读 · 0 评论 -
构建 Web 浏览 AI Agent:Pydantic + MCP 实现指南
更改URL:只需在函数中替换URL,即可总结不同的网页。使用不同的LLM:如果您更喜欢使用OpenAI或其他提供商,请更新model参数并设置适当的API密钥。增强提示:修改提示文本以获得不同类型的网页内容摘要或分析。原创 2025-05-06 22:56:39 · 122 阅读 · 0 评论 -
如何使用Ollama在本地运行Qwen3并支持MCP和工具使用
将Qwen3与Qwen-Agent、MCP和Ollama结合使用,可以得到一个不依赖任何外部云服务的本地AI助手。您可以运行多轮对话,启用实时信息检索,并执行Python代码——全部在本地基础设施内完成。这使其成为开发人员、研究人员和产品团队的理想设置,特别是那些关注隐私、灵活性和可扩展性的人。随着Qwen3的不断发展,我们可以期待其对复杂任务的更强大支持和与自定义工具的无缝集成,为真正自主的本地AI代理铺平道路。原创 2025-05-03 02:13:30 · 264 阅读 · 0 评论 -
如何免费使用 DeepSeek-Prover-V2?
DeepSeek Prover V2在使符号推理变得易于访问和自动化方面迈出了一大步。对教育、辅导或研究非常有用。你可以将其扩展到证明、定理、逻辑谜题等更多领域。你甚至可以在官方页面的 HuggingFace 推理部分免费试用该模型。希望你能尝试这个模型。原创 2025-05-01 20:24:52 · 201 阅读 · 0 评论 -
免费在Colab运行Qwen3-0.6B——轻量高性能实战
Qwen3-0.6B证明了较小的模型正变得更加智能。它在其规模内表现出色,可以轻松在Colab上运行,并且采用开放使用许可。朋友可以尝试下。原创 2025-04-30 18:57:35 · 206 阅读 · 0 评论 -
Context7 MCP:提供实时、版本特定的文档以解决AI幻觉问题
Context7代表了编码辅助工具的新方向,通过实时上下文信息增强开发效率。它有效解决了AI编码助手最大的痛点——版本不匹配导致的API错误。未来随着更多团队采用MCP服务器和llms.txt标准,基于上下文的智能编码体验将成为开发新常态。原创 2025-04-28 23:53:43 · 167 阅读 · 0 评论 -
DeepWiki:AI深度搜索3万个代码库
DeepWiki代表了利用AI进行代码库理解的重大进步。通过自动生成文档并提供交互式探索工具,它降低了理解复杂软件项目的障碍。其技术基础,结合代码分析与先进的LLM,为开发者生产力、入职培训和对开源生态系统的贡献提供了切实的好处。原创 2025-04-27 23:46:36 · 53 阅读 · 0 评论 -
OpenAI 最新 o3 集成到 Cursor 和 Cline 工作流程中
绝对值得。将o3集成到Cursor和Cline中明显增强了编码体验。Cursor凭借其原生支持提供了最简便的路径,使其成为交互式AI辅助的绝佳工具。Cline提供了对更自主、Agent驱动开发的一瞥,尽管目前通过OpenRouter为o3设置略微复杂。关键是了解每个工具的优势并相应地调整你的提示。无论是生成样板代码、调试棘手的逻辑还是自动化多步骤任务,o3都提供了强大的推理引擎。既然你已经了解了设置和潜力,你会首先构建什么?深入探索,实验,看看o3如何改变你的工作流程。原创 2025-04-25 19:32:31 · 146 阅读 · 0 评论 -
从零到多智能体:Google Agent开发套件(ADK)入门指南
ADK促进自定义工具生产的能力是其优势之一。本质上,工具只是一个带有描述性文档字符串的Python函数。原创 2025-04-22 23:33:57 · 529 阅读 · 0 评论 -
开源项目FastAPI-MCP:一键API转换MCP服务
FastAPI MCP是一个零配置工具,可自动将您的FastAPI端点作为模型上下文协议(MCP)工具暴露出来。FastAPI MCP的优点在于其简洁性 — 它接管您现有的API端点并使其对AI模型可访问,而无需您重写代码或创建单独的实现。使用FastAPI MCP,您可以:自动将FastAPI端点转换为MCP工具保留您的API架构和文档将MCP服务器与您的API一起部署或作为单独的服务自定义哪些端点作为工具暴露控制如何生成工具描述。原创 2025-04-20 23:04:06 · 664 阅读 · 0 评论 -
从PDF到播客:MIT开发的超越NotebookLM的工具
使用Hugging Face空间,你不必担心这个问题——因为它是一个Gradio应用,它会自动为你在Hugging Face上创建(或本地运行)的任何空间提供API。NotebookLM是一项令人兴奋的技术,它已经激发了开源社区和许多项目——不仅仅是这一个——将潜在的难懂文本转化为更具吸引力的格式,使即使是最困难的主题也比以往任何时候都更容易理解,而这仅仅是个开始。为了了解推理和TTS的成本有多实惠,在我在此分享的实验中,我制作了一个关于技术趋势报告的播客,大约有50页,生成了15分钟的播客。原创 2025-04-18 19:45:22 · 308 阅读 · 0 评论 -
免费使用RooCode + Boomerang AI + Gemini 2.5 Pro开发套件
截至2025年4月,这套「RooCode+Boomerang+Gemini 2.5 Pro」组合提供了惊艳的智能开发体验,关键是完全免费!它能:✔️ 自动处理重复性工作✔️ 加速开发流程✔️ 替代日费高达$150的商用AI工具。原创 2025-04-16 21:32:57 · 225 阅读 · 0 评论 -
谷歌A2A与Anthropic MCP: AI 智能体互补双协议
当 AI Agents 开始说"同一种语言",世界将发生何种巨变?近日,谷歌宣布开放Agent2Agent(A2A)协议,在社交媒体上引发轩然大波。A2A代码实践阅读上篇文章。但在炒作背后,隐藏着一个关于技术协同的精彩故事——看似竞争的两种协议实则形成了强大的互补。让我们解码这场技术变革的深层逻辑。原创 2025-04-14 21:58:54 · 97 阅读 · 0 评论 -
谷歌A2A协议入门指南:附简易Python代码示例
继"关税"之后,当下最热门的词汇当属AI智能体——这种基于人工智能的软件能够执行复杂任务、实现工作流自动化并提升生产效率。但迄今为止,大多数智能体都处于各自为政的状态,难以顺畅协作。就像团队执行重大项目时,成员之间却无法交流!对于技术人员而言,一个可能遇到的典型场景是:假设你需要协调四个不同的AI服务——处理用户查询的Gemini智能体、在向量数据库进行搜索的AI应用、基于Claude的摘要生成器,以及运行专业领域逻辑的Python智能体。原创 2025-04-13 21:28:51 · 131 阅读 · 0 评论 -
微软VSCode 能否击败 Cursor 和 Windsurf?
微软是否能利用平台优势和许可限制来阻止竞争对手?原创 2025-04-12 20:29:15 · 450 阅读 · 0 评论 -
开源Cursor替代品——Void
我原先写过很多关于Cursor文章。今天分享一个开源的 Cursor 替代方案。如果你也热爱开源项目,那么这篇文章正是为你准备的!原创 2025-04-11 21:03:06 · 462 阅读 · 0 评论 -
谷歌推出可免费使用的Firebase Studio:Gemini全栈AI开发利器
🔥 谷歌Firebase Studio:用AI写代码!用自然语言+60多个模板+Gemini构建应用,完全免费,浏览器即可使用。现已开放抢先体验!原创 2025-04-10 23:39:01 · 479 阅读 · 0 评论 -
我是如何免费获取Cursor Pro的操作教程
我是个爱钻研技巧的抠门程序员,所以当我发现能不花一分钱搞到Cursor Pro时,简直乐疯了。这款高端代码编辑器我眼馋了好久,而这个妙招在我的Windows系统上完美奏效。虽然不是什么技术大神——不过是个写了十多年代码文章的普通码农——我会用最简单的方式说清楚。原创 2025-04-10 00:24:56 · 688 阅读 · 0 评论 -
如何免费使用Meta Llama 4?
作为开源模型,Llama 4存在一个重大限制——庞大的体积。该系列最小的Llama 4 Scout模型就拥有1090亿参数,如此庞大的规模根本无法在本地系统运行。如果你拥有足够强的显卡,还可以下载完整模型权重——本篇指南将为你详解所有获取方式。Hugging Face平台提供了多种精度的Llama4模型(如FP8等),适合开发者使用。OpenRouter.ai 提供免费的 Llama 4 模型 API 访问权限。:适合需要快速集成 Llama 4 API 的开发者或想免费体验最新模型的用户。原创 2025-04-07 21:34:34 · 301 阅读 · 0 评论 -
对比Augment Code、Cursor与Windsurf:哪款AI编程工具更胜一筹?[特殊字符]
在AI驱动的编程工具领域,开发者们如今拥有众多创新选择,这些工具旨在优化工作流程并提升效率。其中Augment Code、Cursor和Windsurf堪称佼佼者。本文将深入解析它们的功能特色、核心优势与差异,助你找到最适合自己的开发利器。Augment Code凭借高效处理大型代码库的能力崭露头角,其快速索引功能尤为突出,成为开发复杂多文件项目者的优选。:快速定位错误并提供修复建议:无缝对接海量数据集:相比Cursor和Windsurf,对预算有限的开发者极具吸引力。原创 2025-04-05 21:25:32 · 1830 阅读 · 0 评论 -
使用Claude Desktop和MCP工具创建个人编程助手
模型上下文协议(Model Context Protocol)是一个开放标准,旨在促进AI模型与外部工具/数据源间的无缝通信。该协议采用客户端-服务器架构,能安全高效地实现AI模型与各类系统的交互。原创 2025-04-02 21:12:48 · 1298 阅读 · 0 评论 -
Colab上运行Gemma 3 + Ollama:开发者快速入门指南
至此,您已掌握:在Google Colab通过Ollama运行Gemma 3通过命令行和Python与模型交互处理文本和图像输入构建流式响应和基础聊天应用。原创 2025-04-01 20:09:42 · 176 阅读 · 0 评论 -
使用Google Gemini API密钥创建AI驱动的Chrome扩展程序
借助Google Gemini API,将尖端AI能力集成到Chrome扩展从未如此简单。只需几个步骤,你就能打造一个能即时回答问题、总结网页、翻译内容的全能扩展——一切触手可及!💡这仅仅是开始!通过Gemini的AI赋能,扩展的可能性无穷无尽。无论是开发自动化工具、增强浏览体验,还是提升工作效率,AI驱动扩展的未来都充满光明前景🌟!接下来呢?发挥创意,立即开始构建属于你的AI动力Chrome扩展吧!🔧💻✨。原创 2025-03-31 21:51:26 · 407 阅读 · 0 评论 -
我用DeepSeek Coder模型构建了AI智能体来实现代码生成与审查
你是一名资深AI开发工程师。请根据以下任务要求编写**整洁、高效且文档完整**的代码片段:必须满足以下要求:- 遵循最佳编码实践- 使用有意义的变量名和注释- 优化性能和可读性- 尽可能保持简洁和模块化任务描述:{task_description}生成代码:""")这是首个AI智能体,扮演高级开发工程师角色。它接收任务描述并生成符合以下标准的优质Python代码:语义明确的变量命名清晰的代码注释性能优化处理模块化函数设计。原创 2025-03-30 21:07:27 · 158 阅读 · 0 评论 -
免费使用Gemini 2.5 Pro的完整教程
谷歌Gemini 2.5 Pro发布:100万token上下文+超强推理+多模态,现可免费试用!原创 2025-03-26 21:12:01 · 1717 阅读 · 0 评论 -
使用Mastra.ai构建AI智能体:一次动手实践
这次Mastra初体验令人惊喜。从零开始构建AI智能体的过程异常顺畅,短短几分钟就能让首个智能体投入运行。该框架集成了记忆功能、工具整合和模块化架构等特性,使开发过程既直观又充满成就感。作为个人项目的技术选型,Mastra表现亮眼——它不仅开源且维护活跃,开发者体验也相当出色。当然,作为新生框架,Mastra还存在一些早期项目特有的不足。但开发团队在Discord社区的快速响应和专业支持令人印象深刻,这让我对其发展前景充满信心。原创 2025-03-24 22:55:03 · 164 阅读 · 0 评论 -
你应该信任AI来编写你的代码吗?关于Vibe编程的真相
这听起来像是终极的生产力技巧,但这种策略有利有弊。氛围编程就像在繁忙的厨房里有一位AI副厨师——它能高效地准备菜肴,但仍需要一位有才华的厨师来指导最后的呈现。想象一下,你的AI伙伴正在重写你的代码,而它完全按照你的设想工作——无需调试,无需手动编辑,只需感受氛围。然而,如果你是一个试图完全依赖AI完成任务的编程新手,你可能会遇到比解决方案更多的问题。正如AI可以以惊人的速度生成代码,审查、完善和优化代码的过程仍然需要人类的专业知识。——借助AI生成的代码,概念验证项目的部署非常简单,几乎不费吹灰之力。原创 2025-03-23 18:47:29 · 93 阅读 · 0 评论 -
Gemini 2.0 Flash 改变图像编辑
Google AI Studio正在引领AI驱动的图像编辑技术的快速发展。通过Gemini 2.0 Flash实验模型,您可以轻松编辑图像。只需一个指令,您就可以执行多种操作,如上色、去除水印和创意转换。开始使用Google AI Studio。原创 2025-03-20 19:59:02 · 125 阅读 · 0 评论