- 博客(728)
- 资源 (24)
- 问答 (1)
- 收藏
- 关注
原创 OpenAI推出o3-Pro模型
OpenAI宣布了两个重大更新。首先,o3模型的价格降低了80%。其次,他们发布了一个名为o3-pro的新模型。o3-pro目前是OpenAI最先进的多模态模型,具有深度推理能力。它逐步解决问题,使其能够在编程、数学、科学、视觉感知等众多领域中更可靠地执行任务。
2025-06-11 23:59:07
903
原创 对比三款最佳的代理式 CLI 编程工具
像 Aider、Claude Code 和 Codex CLI 这样的命令行人工智能编程工具,通过任务委托和自动化,帮助开发者更快地工作并改善工作流程。它们是 VS Code 和 Cursor 等领先人工智能代码编辑器的直接替代品,并为工程师与人工智能代理协作开辟了新的领域。
2025-06-11 09:14:27
25
原创 我如何使用 CodeMCP 进行开发并控制其他编程助手的预算
虽然像 Cursor 这样的工具提供了出色的功能,但在密集编程会话中,它们基于 Token 的定价可能会迅速累积。以下是我如何战略性地使用 CodeMCP 来处理特定的开发任务,然后再使用付费助手。
2025-06-09 10:00:54
101
原创 99% 的 Claude 4 用户不知道这个功能的存在
摘要:Anthropic为AI助手Claude设计了分层思考模式,其中最高级的"Ultrathink(超级思考)"功能可分配最大计算资源。当Claude陷入重复循环、复杂问题或多步推理困境时,使用该指令可使其同时评估多种方案,连接不相关信息,更系统地解决问题。该功能不仅适用于编码,还可用于分析、战略规划等场景。官方文档证实这是通过"think"触发词实现的扩展思考模式,建议在复杂调试、架构决策等需要深度思考的场景中主动使用这一隐藏功能。(149字)
2025-06-06 22:02:39
232
原创 Cursor 1.0 终于发布了
Cursor 1.0 正式发布,带来多项重要更新:1)BugBot自动代码审查功能可分析PR差异并给出修复建议;2)全面开放后台代理功能(需关闭隐私模式);3)支持在Jupyter笔记本中直接编辑;4)新增记忆功能,按项目存储对话信息;5)简化MCP服务器设置流程并支持OAuth认证;6)聊天响应支持可视化内容输出;7)全新仪表盘提供详细使用统计。该版本标志着这款估值100亿美元的AI编程工具进入新阶段,此前OpenAI曾试图收购未果。
2025-06-05 19:40:07
247
原创 Manus AI 现在可以生成短片了
Manus AI推出全自动视频生成功能 热门AI工具Manus AI宣布上线视频生成功能,用户仅需输入文字提示即可自动完成故事板设计、场景生成及视频剪辑全流程,无需手动操作。该功能支持从单条提示生成完整短片,甚至能构建视频平台类网络应用。与Google Flow等需要人工干预的工具不同,Manus AI主打全自动化处理,但当前视频质量(如角色建模和动画流畅度)仍不及专业AI视频工具。虽然该技术展现了内容创作的未来方向,但现阶段更适合快速概念可视化而非专业制作。随着视频模型的快速迭代,这类工具或将在教育、广告
2025-06-04 20:00:00
971
原创 Agno:使用简单代码构建AI智能体
本文介绍了使用Agno框架构建AI智能体的基础方法。作者通过两个示例展示了如何创建简单智能体:第一个示例演示了基本智能体的创建过程,第二个示例则通过集成YouTube转录工具构建了一个教学辅助智能体。文章强调了智能体的核心特征(工具集成能力)和关键构建参数(如模型选择、指令设置等),并提供了本地部署和云部署方案。最后,作者建议聚焦单一任务、优化提示工程、合理使用工具,避免过度复杂化智能体设计。这种实践导向的指南为开发者快速上手智能体开发提供了清晰路径。
2025-06-03 20:57:46
152
原创 混元开源HunyuanVideo-Avatar:语音数字人模型
腾讯推出开源视频生成模型HunyuanVideo-Avatar,可将照片和音频合成为动态视频。该模型基于多模态扩散架构,具备角色图像注入、音频情感控制和多人面部识别三大创新功能,支持本地部署。相比Google Veo 3等闭源方案,其最大优势在于开源特性,但需要高性能GPU(最低24GB显存)。虽然演示效果惊艳(如精准唇形同步和多角色互动),实际应用仍存在生成速度慢(10秒视频需1小时)、情感控制依赖参考图像等技术瓶颈。目前模型已开放权重下载和在线试用,为动画制作、内容创作等领域提供新工具,但距离商业化成熟
2025-06-03 07:12:22
764
原创 别依赖Vibe Coding提升代码质量,主动执行才是关键!
摘要: AI编程工具快速发展,但代码质量仍是核心挑战。尽管AI生成的代码初始表现良好,但反复修改后常出现冗余、单体结构、孤立代码等问题。解决方案包括: 使用自定义指令:设定代码质量标准(如模块化、安全性、测试覆盖等)。 强化“完成定义”:每次迭代后强制AI检查可量化指标(如代码行数、文档覆盖率),确保质量标准持续生效。 自动化验证:结合工具(如静态分析、测试覆盖率检测)客观评估代码,避免AI“遗忘”规则。 关键结论:开发者需主动管理AI输出,通过可衡量的规则和工具保障代码质量,而非依赖模型的默认行为。 (字
2025-06-02 00:19:59
44
1
原创 使用MCP和Ollama本地创建AI代理:实操教程
摘要 Anthropic推出的模型上下文协议(MCP)为大型语言模型与外部资源交互提供了标准化框架。通过MCP客户端(如ChatGPT)与服务器(如文件系统服务)的通信,AI工具能安全访问数据和工具。本文演示了如何构建本地MCP客户端:安装所需环境后,配置stdio传输的服务器参数,获取服务器信息及可用工具(如文件读写功能),并通过Ollama API将工具集成到LLM交互流程中。MCP的两种传输机制(stdio和流式HTTP)支持不同场景下的模型扩展能力开发。
2025-05-31 23:02:22
630
原创 可灵2.1 vs Veo 3:AI视频生成谁更胜一筹?
可灵2.1发布三款视频生成模式:720p标准模式(20积分/5秒)、1080p专业模式(35积分/5秒)和1080p大师模式(100积分/5秒)。新版本在人物动作、面部细节和动画风格上表现突出,但仍存在手指动作不自然等问题。相比Google Veo 3,可灵2.1在视觉质量上更具优势,但音频生成流程繁琐。价格方面可灵更具竞争力,Veo 3仅限高价订阅用户使用。最终选择可能取决于创作者对画质与工作流程便利性的权衡。
2025-05-31 20:42:29
1372
原创 DeepSeek R1-0528 新开源推理模型(免费且快速)
DeepSeek低调推出全新开源模型R1-0528,总参数量达6710亿但推理时仅激活370亿参数,采用稀疏专家混合架构并支持164K tokens上下文窗口。该模型在MMLU基准测试中表现接近OpenAI o3/o4 mini,代码生成能力仅次于OpenAI,超越Grok 3 Mini等竞品。用户可通过OpenRouter免费API、DeepSeek收费API(1.95美元/百万输入token)或本地部署(量化后131GB)使用。MIT许可证下的完全开源特性为开发者提供了罕见的研究透明度,标志着开源AI已
2025-05-29 19:52:03
1914
1
原创 AG-UI 详解(非技术人员简易指南!!)
AG-UI 是一种创新协议,旨在简化AI智能体与用户界面(前端)的交互。它通过标准化事件(如“运行开始”“工具调用”)实现实时通信,使非技术用户也能流畅使用AI功能,例如旅行规划或智能家居控制。AG-UI支持实时反馈(如逐字显示回复)和跨工具协作,且开源特性鼓励开发者社区共同优化。尽管仍处发展阶段,其框架无关的设计(兼容任意技术栈)和易用性已展现出潜力,有望推动AI应用更自然地融入日常生活。如同“数字世界的通用翻译器”,AG-UI正在降低AI技术门槛,让更多场景实现无缝人机交互。
2025-05-28 19:10:23
81
原创 VOID IDE: 类似 Cursor + Windsurf 替代品!
VOID IDE是一款免费开源的AI代码编辑器,作为Cursor等商业工具的替代品,基于VS Code开发并内置强大AI功能。它提供两种智能体模式(完全权限的安全模式和只读的收集模式),支持连接多种主流AI模型或本地运行开源模型,确保数据隐私。特色功能包括变更检查点、快速应用修改和原生工具集成。测试显示它能高效构建项目(如SaaS登录页),但界面略显迟缓且缺少MCP支持。适合注重隐私、偏好开源或想免费用AI的VS Code用户。该工具由Y Combinator支持并持续更新,有望成为开发者首选。
2025-05-28 01:17:22
69
原创 Google 发布AI 编程工具Jules
Google最新推出的AI编程代理Jules采用独特的异步工作模式,区别于现有的交互式编程助手。Jules能自主完成复杂编程任务:通过GitHub集成访问代码库,在虚拟机环境中独立执行任务,生成详细实施计划供开发者审核,最终自动提交PR。测试显示其能高效完成依赖升级等任务,但保留原始依赖项等细节仍需优化。作为免费工具(每日5个任务限额),Jules展现了AI代理处理常规开发工作的潜力,预示着未来开发者将更多转向任务规划和代码审查的角色。这种转变将强化对软件工程核心原理的掌握需求,而非削弱开发者价值。
2025-05-26 20:07:31
363
原创 Google 推出 Flow —— AI 电影制作新平台
Google在I/O 2025大会上推出AI视频创作平台Flow,整合了Imagen 4、Veo 3和Gemini Pro等先进模型。Flow提供三种视频生成方式:文本到视频、帧到视频和素材到视频,并配备相机控制、场景构建等专业功能。目前仅限美国AI Pro(19.99美元/月)和AI Ultra(249.99美元/月)订阅用户使用,其中Ultra版独家提供Veo 3原生音频功能。尽管定价较高,但Flow简化了AI视频创作流程,有望革新内容创作领域。
2025-05-25 23:19:53
749
1
原创 GitHub Copilot 现已支持 AI Coding Agent
自从 GitHub Copilot 推出以来,我一直在想——如果它能超越建议功能,真正像一个自主的队友一样工作会怎样?一个能够编码、修复错误、运行测试,并独立处理 CI/CD 工作流程的队友?
2025-05-25 21:07:55
460
原创 Claude 4 在 SWE-Bench 上得分 72.7%:对编程的意义
Claude 4 在 SWE-bench 基准测试中取得了 72.7% 的得分,这意味着它在解决真实编程问题上的能力显著提升。SWE-bench 是一个类似于 SAT 考试的测试,包含来自 GitHub 的实际编程错误,要求 AI 模型修复这些复杂问题。Claude 4 的得分比之前的最高分 62.3% 提高了 10 个百分点,表明它在 100 个错误中能正确修复 73 个,而无需人类干预。这一进步意味着开发者可以更快地解决日常编程问题,项目进展将更顺利,功能交付更迅速。对于编程学习者,Claude 4 是
2025-05-23 21:00:11
832
1
原创 AI编程: OpenAI Codex vs Google Jules vs GitHub Copilot++
2025年,AI编程助手领域迎来重大突破,微软、OpenAI和谷歌分别推出了Copilot++、Codex和Jules,这些工具已超越传统自动补全功能,成为真正的编程助手。它们能够理解任务、运行测试、提出拉取请求,并提供变更日志,极大地提升了开发效率。Codex在并行沙盒环境中运行,适合多任务开发者;Jules以音频优先的体验为特色,适合追求异步生产力的团队;Copilot++则通过GitHub Actions集成,优化了CI/CD工作流程。这些AI助手的出现,标志着编程方式的新变革,开发者可以根据需求选择
2025-05-22 21:55:53
534
原创 Manus AI 现已向所有人免费开放
Manus 是一款于2025年3月推出的AI聊天机器人,在短短七天内就有超过200万人加入等待名单。这个数字本身就说明了很多。当时,人们称之为又一个"DeepSeek时刻"。
2025-05-19 19:57:51
72
原创 OpenAI推出Codex — ChatGPT内置的软件工程Agents
OpenAI最近推出了Codex的研究预览版,这是其最强大的AI编码助手,专为开发者设计。Codex能够编写代码、修复错误、运行测试,并在安全的云环境中管理多个编码任务。它基于codex-1模型,通过强化学习训练,能够生成符合人类风格的代码,并准确执行指令。Codex目前仅支持通过GitHub仓库进行任务分配,且无法访问互联网,这限制了其环境设置能力。尽管存在这些限制,Codex被视为未来AI编码助手的先驱,有望改变软件开发的工作方式。目前,Codex仅对ChatGPT Pro、Enterprise和Tea
2025-05-18 20:43:45
539
原创 Canva 推出自有应用生成器以与 Bolt 和 Lovable 竞争
Canva,一个以图形设计闻名的平台,在其2025活动中推出了AI代码生成器,加入了AI市场的竞争。这一工具集成在Canva界面中,用户可以通过描述需求来生成代码,并实时预览应用程序。然而,初步使用体验显示,该工具生成代码速度慢,功能有限,且用户无法直接访问或编辑生成的代码,缺乏灵活性和版本控制。尽管Canva的目标是简化非开发者的应用程序创建过程,但当前版本显得不成熟,与市场上其他AI编码平台相比存在明显不足。Canva未来可能会整合其设计工具和代码生成器,以提供更全面的解决方案。
2025-05-17 23:22:34
369
原创 MGX:多智能体管理开发流程
MGX(MetaGPT X)通过其多智能体团队和专家混合系统,彻底改变了AI辅助开发流程。与当前专注于单一领域的工具不同,MGX采用团队式方法,管理整个开发生命周期,模拟创业公司内的角色分工。团队包括领导、产品经理、架构师、工程师和数据专家,他们协作处理复杂项目。用户只需提供简单提示,MGX团队即可从需求分析到部署,完成全栈开发。MGX不仅提供端到端开发支持,还通过多阶段审查确保高质量结果,展示了AI辅助工具的未来潜力。
2025-05-16 20:19:29
131
原创 Cursor vs VS Code vs Zed
代码编辑器的世界已经迎来了创新的爆发。曾经由重量级IDE或基础文本编辑器主导的领域,如今开发者们发现自己正在探索全新一波聚焦于AI集成、协作和性能的工具。在本文中,我们将深入探讨2025年三款流行的编辑器:Cursor、Visual Studio Code (VS Code)和Zed Code Editor。每一款都为开发体验带来了独特的方法——无论你是寻求AI驱动的编码、深度定制,还是闪电般快速的协作。
2025-05-15 21:03:29
170
原创 Cursor 0.5版本发布,新功能介绍
Cursor在v0.50版本中推出了多项新功能,旨在提升开发者的编程体验。主要更新包括:Max模式,提供更精细的上下文控制和基于tokens的定价系统;新的Tab模型,支持跨多文件的建议和更快的代码导航;后台代理,允许并行运行多个代理以处理更大任务;完整代码库上下文,通过@folders功能将整个代码库纳入上下文;更新的行内编辑,增加了完整文件编辑和代理交接功能;快速编辑工具,提升长文件处理效率;多根工作区,支持同时访问多个代码库。这些改进使Cursor在AI编程工具中保持领先地位,并展示了其持续创新的能力
2025-05-14 23:08:57
152
原创 InternVL3: 利用AI处理文本、图像、视频、OCR和数据分析
InternVL3 是一款突破性的视觉-语言模型,通过无缝集成视觉和语言处理,显著提升了多模态理解、推理和感知能力。它在图像-文本、视频-文本和纯文本数据的处理上表现出色,支持从1B到78B的多种参数规模,适应不同计算需求。InternVL3引入了可变视觉位置编码(V2PE)和原生多模态预训练,优化了OCR、工业图像分析、3D感知和GUI交互等复杂任务。用户可通过简单的安装步骤在Google Colab上快速体验其功能,适用于广泛的现实场景应用。
2025-05-13 20:41:19
272
原创 使用ACE-Step在本地生成AI音乐
ACE-Step v1-3.5B是由ACE Studio和StepFun开发的开源音乐生成模型,旨在从自然语言提示生成完整的音乐音轨。该模型基于扩散框架,结合深度压缩自编码器和轻量级线性transformer,能够生成丰富、多乐器的作品,并在长篇音乐生成方面表现出色。ACE-Step特别之处在于它允许用户提供一个短音乐片段作为起点,然后将其扩展为完整的作品,同时保持原始的风格、情绪和乐器编排。该模型在消费级硬件上高效运行,无需云处理,支持多语言和多风格,并具备声音克隆和风格转换等独特功能。用户可以通过简单的
2025-05-12 20:53:38
734
原创 AugmentCode 非常昂贵的新定价
AugmentCode 近期大幅调整了其定价结构,月费从30美元涨至50美元,涨幅达67%,并删除了部分功能,如无限代理请求。
2025-05-11 22:51:08
603
原创 OpenAI 坚持非盈利公司结构
OpenAI近期宣布将其营利性部门OpenAI LLC转变为公共福利公司(PBC),同时保留非营利性母公司OpenAI Inc.的控制权。这一决策旨在平衡盈利能力与社会责任,推动AI技术为更广泛的公共利益服务,而不仅仅是为大型科技公司创造利润。CEO Sam Altman强调,这一转变将赋予用户更多自主权,开源更多AI模型,并让用户决定AI的运行模式,体现“民主化AI”的理念。然而,随着AI开发加速,确保安全性和可靠性成为关键挑战。OpenAI还计划组建新的咨询委员会,确保AI技术在教育、医疗、科学和公共服
2025-05-10 21:23:31
811
原创 Vibe Coding: 优点与缺点
"氛围编程"(vibe coding)是开发圈中的新趋势,它通过AI辅助工具如Cursor实现快速迭代和实时反馈,显著提升开发效率。
2025-05-09 23:19:39
326
原创 Google 发布 Gemini 2.5 Pro Preview (I/O Edition),具有增强的编程能力
Google近日发布了其最新的AI模型Gemini 2.5 Pro Preview "I/O Edition",该模型在编程能力上进行了显著增强,特别是在网页开发领域表现突出。
2025-05-08 21:01:36
158
原创 OpenAI以30亿美元收购Windsurf(Codeium):对编程未来的押注
基本上,OpenAI想要自己的Copilot,自己的IDE原生工具,和自己的数据——不再是GitHub Copilot中沉默的合作伙伴,让微软获得荣誉(和遥测数据)。在可能成为其最大规模收购案的交易中,据报道,OpenAI正以惊人的30亿美元收购Windsurf,这是一款曾名为Codeium的AI驱动编码工具。但Windsurf是即插即用的AI强者,有了OpenAI的资源,它可能会比你输入"npm install"还快地从"酷工具"变成"行业标准"。这不仅仅是一笔商业交易——这是向软件开发未来的大胆飞跃。
2025-05-07 20:24:10
35
原创 构建 Web 浏览 AI Agent:Pydantic + MCP 实现指南
更改URL:只需在函数中替换URL,即可总结不同的网页。使用不同的LLM:如果您更喜欢使用OpenAI或其他提供商,请更新model参数并设置适当的API密钥。增强提示:修改提示文本以获得不同类型的网页内容摘要或分析。
2025-05-06 22:56:39
157
原创 Qwen2_5-Omni-3B:支持视频、音频、图像和文本的全能AI,可在本地运行
Qwen2.5-Omni-3B代表了多模态AI普及化的重要一步。它将视频、音频、图像和文本处理打包到一个紧凑的3B参数模型中,平衡了功能和实用性。对于开发者、研究人员和组织来说,这是一个不需要大量计算资源就能实现多模态AI的解决方案。在Hugging Face上的可用性进一步降低了使用门槛。随着多模态AI的发展,像Qwen2.5-Omni-3B这样紧凑而功能强大的模型将在日常应用中发挥关键作用。无论是构建内容审核系统、教育平台还是辅助工具,这个模型都提供了一个有力的基础。
2025-05-05 22:49:57
1498
原创 5个情感丰富GPT-4o图像提示词(不是吉卜力风格)
创建一个9:16垂直画布,展示九个3D可爱迷你风格贴纸,描绘一个中等肤色、深色卷发、留胡子、戴墨镜的男子,穿着休闲和半休闲服装,展示不同姿势和情绪,如挥手、思考、大笑、竖起大拇指和睡觉。确保所有九个贴纸都有可见文字,保持角色风格一致,如可爱的超大头部、富有表现力的姿势、简单细节的服装,并确保光线柔和而活泼,呈现生动、精致的外观。在这一趋势中最引人入胜的方向之一是"吉卜力风格之后"的图像的兴起——一种受到吉卜力工作室讲故事风格和美学影响的视觉语言,却应用于个人品牌、旅行、创业文化等现代概念。
2025-05-04 23:05:21
1062
原创 揭秘微软与OpenAI的147亿美元决裂内幕
但微软对OpenAI要求更多算力的态度渐趋消极,尤其是在投入800亿美元建设自有AI基础设施的背景下。去年夏天,OpenAI推迟共享一个强大推理模型的代码,阻碍了微软将其整合到Copilot的计划。这一趋势体现在OpenAI的GPT商店与微软Copilot的竞争,以及微软探索替代模型上。对OpenAI而言,失去微软的算力资源可能延缓其AGI目标,特别是在面临2025年预计50亿美元亏损的情况下。OpenAI与甲骨文和CoreWeave的合作,以及微软对Phi-4的投资,表明双方都在为独立未来做准备。
2025-05-03 20:55:53
1240
原创 如何使用Ollama在本地运行Qwen3并支持MCP和工具使用
将Qwen3与Qwen-Agent、MCP和Ollama结合使用,可以得到一个不依赖任何外部云服务的本地AI助手。您可以运行多轮对话,启用实时信息检索,并执行Python代码——全部在本地基础设施内完成。这使其成为开发人员、研究人员和产品团队的理想设置,特别是那些关注隐私、灵活性和可扩展性的人。随着Qwen3的不断发展,我们可以期待其对复杂任务的更强大支持和与自定义工具的无缝集成,为真正自主的本地AI代理铺平道路。
2025-05-03 02:13:30
385
redis详细笔记
2016-10-04
数学分析三大基本思想之分解
2018-08-05
数学分析三大基本思想之逼近
2018-08-05
plsql developer 11.zip
2019-07-22
自定义rpc框架
2018-09-29
hadoop-2.6.1.zip
2020-06-16
《Spark GraphX实战》_时金魁.pdf
2019-06-30
js通用方法
2018-04-01
大数据时代总结
2018-08-05
推荐:数据中台-协作流程
2021-08-30
TA创建的收藏夹 TA关注的收藏夹
TA关注的人