- 博客(704)
- 资源 (24)
- 问答 (1)
- 收藏
- 关注
原创 Canva 推出自有应用生成器以与 Bolt 和 Lovable 竞争
Canva,一个以图形设计闻名的平台,在其2025活动中推出了AI代码生成器,加入了AI市场的竞争。这一工具集成在Canva界面中,用户可以通过描述需求来生成代码,并实时预览应用程序。然而,初步使用体验显示,该工具生成代码速度慢,功能有限,且用户无法直接访问或编辑生成的代码,缺乏灵活性和版本控制。尽管Canva的目标是简化非开发者的应用程序创建过程,但当前版本显得不成熟,与市场上其他AI编码平台相比存在明显不足。Canva未来可能会整合其设计工具和代码生成器,以提供更全面的解决方案。
2025-05-17 23:22:34
30
原创 MGX:多智能体管理开发流程
MGX(MetaGPT X)通过其多智能体团队和专家混合系统,彻底改变了AI辅助开发流程。与当前专注于单一领域的工具不同,MGX采用团队式方法,管理整个开发生命周期,模拟创业公司内的角色分工。团队包括领导、产品经理、架构师、工程师和数据专家,他们协作处理复杂项目。用户只需提供简单提示,MGX团队即可从需求分析到部署,完成全栈开发。MGX不仅提供端到端开发支持,还通过多阶段审查确保高质量结果,展示了AI辅助工具的未来潜力。
2025-05-16 20:19:29
96
原创 Cursor vs VS Code vs Zed
代码编辑器的世界已经迎来了创新的爆发。曾经由重量级IDE或基础文本编辑器主导的领域,如今开发者们发现自己正在探索全新一波聚焦于AI集成、协作和性能的工具。在本文中,我们将深入探讨2025年三款流行的编辑器:Cursor、Visual Studio Code (VS Code)和Zed Code Editor。每一款都为开发体验带来了独特的方法——无论你是寻求AI驱动的编码、深度定制,还是闪电般快速的协作。
2025-05-15 21:03:29
61
原创 Cursor 0.5版本发布,新功能介绍
Cursor在v0.50版本中推出了多项新功能,旨在提升开发者的编程体验。主要更新包括:Max模式,提供更精细的上下文控制和基于tokens的定价系统;新的Tab模型,支持跨多文件的建议和更快的代码导航;后台代理,允许并行运行多个代理以处理更大任务;完整代码库上下文,通过@folders功能将整个代码库纳入上下文;更新的行内编辑,增加了完整文件编辑和代理交接功能;快速编辑工具,提升长文件处理效率;多根工作区,支持同时访问多个代码库。这些改进使Cursor在AI编程工具中保持领先地位,并展示了其持续创新的能力
2025-05-14 23:08:57
103
原创 InternVL3: 利用AI处理文本、图像、视频、OCR和数据分析
InternVL3 是一款突破性的视觉-语言模型,通过无缝集成视觉和语言处理,显著提升了多模态理解、推理和感知能力。它在图像-文本、视频-文本和纯文本数据的处理上表现出色,支持从1B到78B的多种参数规模,适应不同计算需求。InternVL3引入了可变视觉位置编码(V2PE)和原生多模态预训练,优化了OCR、工业图像分析、3D感知和GUI交互等复杂任务。用户可通过简单的安装步骤在Google Colab上快速体验其功能,适用于广泛的现实场景应用。
2025-05-13 20:41:19
183
原创 使用ACE-Step在本地生成AI音乐
ACE-Step v1-3.5B是由ACE Studio和StepFun开发的开源音乐生成模型,旨在从自然语言提示生成完整的音乐音轨。该模型基于扩散框架,结合深度压缩自编码器和轻量级线性transformer,能够生成丰富、多乐器的作品,并在长篇音乐生成方面表现出色。ACE-Step特别之处在于它允许用户提供一个短音乐片段作为起点,然后将其扩展为完整的作品,同时保持原始的风格、情绪和乐器编排。该模型在消费级硬件上高效运行,无需云处理,支持多语言和多风格,并具备声音克隆和风格转换等独特功能。用户可以通过简单的
2025-05-12 20:53:38
669
原创 AugmentCode 非常昂贵的新定价
AugmentCode 近期大幅调整了其定价结构,月费从30美元涨至50美元,涨幅达67%,并删除了部分功能,如无限代理请求。
2025-05-11 22:51:08
151
原创 OpenAI 坚持非盈利公司结构
OpenAI近期宣布将其营利性部门OpenAI LLC转变为公共福利公司(PBC),同时保留非营利性母公司OpenAI Inc.的控制权。这一决策旨在平衡盈利能力与社会责任,推动AI技术为更广泛的公共利益服务,而不仅仅是为大型科技公司创造利润。CEO Sam Altman强调,这一转变将赋予用户更多自主权,开源更多AI模型,并让用户决定AI的运行模式,体现“民主化AI”的理念。然而,随着AI开发加速,确保安全性和可靠性成为关键挑战。OpenAI还计划组建新的咨询委员会,确保AI技术在教育、医疗、科学和公共服
2025-05-10 21:23:31
791
原创 Vibe Coding: 优点与缺点
"氛围编程"(vibe coding)是开发圈中的新趋势,它通过AI辅助工具如Cursor实现快速迭代和实时反馈,显著提升开发效率。
2025-05-09 23:19:39
298
原创 Google 发布 Gemini 2.5 Pro Preview (I/O Edition),具有增强的编程能力
Google近日发布了其最新的AI模型Gemini 2.5 Pro Preview "I/O Edition",该模型在编程能力上进行了显著增强,特别是在网页开发领域表现突出。
2025-05-08 21:01:36
105
原创 OpenAI以30亿美元收购Windsurf(Codeium):对编程未来的押注
基本上,OpenAI想要自己的Copilot,自己的IDE原生工具,和自己的数据——不再是GitHub Copilot中沉默的合作伙伴,让微软获得荣誉(和遥测数据)。在可能成为其最大规模收购案的交易中,据报道,OpenAI正以惊人的30亿美元收购Windsurf,这是一款曾名为Codeium的AI驱动编码工具。但Windsurf是即插即用的AI强者,有了OpenAI的资源,它可能会比你输入"npm install"还快地从"酷工具"变成"行业标准"。这不仅仅是一笔商业交易——这是向软件开发未来的大胆飞跃。
2025-05-07 20:24:10
23
原创 构建 Web 浏览 AI Agent:Pydantic + MCP 实现指南
更改URL:只需在函数中替换URL,即可总结不同的网页。使用不同的LLM:如果您更喜欢使用OpenAI或其他提供商,请更新model参数并设置适当的API密钥。增强提示:修改提示文本以获得不同类型的网页内容摘要或分析。
2025-05-06 22:56:39
94
原创 Qwen2_5-Omni-3B:支持视频、音频、图像和文本的全能AI,可在本地运行
Qwen2.5-Omni-3B代表了多模态AI普及化的重要一步。它将视频、音频、图像和文本处理打包到一个紧凑的3B参数模型中,平衡了功能和实用性。对于开发者、研究人员和组织来说,这是一个不需要大量计算资源就能实现多模态AI的解决方案。在Hugging Face上的可用性进一步降低了使用门槛。随着多模态AI的发展,像Qwen2.5-Omni-3B这样紧凑而功能强大的模型将在日常应用中发挥关键作用。无论是构建内容审核系统、教育平台还是辅助工具,这个模型都提供了一个有力的基础。
2025-05-05 22:49:57
1399
原创 5个情感丰富GPT-4o图像提示词(不是吉卜力风格)
创建一个9:16垂直画布,展示九个3D可爱迷你风格贴纸,描绘一个中等肤色、深色卷发、留胡子、戴墨镜的男子,穿着休闲和半休闲服装,展示不同姿势和情绪,如挥手、思考、大笑、竖起大拇指和睡觉。确保所有九个贴纸都有可见文字,保持角色风格一致,如可爱的超大头部、富有表现力的姿势、简单细节的服装,并确保光线柔和而活泼,呈现生动、精致的外观。在这一趋势中最引人入胜的方向之一是"吉卜力风格之后"的图像的兴起——一种受到吉卜力工作室讲故事风格和美学影响的视觉语言,却应用于个人品牌、旅行、创业文化等现代概念。
2025-05-04 23:05:21
1035
原创 揭秘微软与OpenAI的147亿美元决裂内幕
但微软对OpenAI要求更多算力的态度渐趋消极,尤其是在投入800亿美元建设自有AI基础设施的背景下。去年夏天,OpenAI推迟共享一个强大推理模型的代码,阻碍了微软将其整合到Copilot的计划。这一趋势体现在OpenAI的GPT商店与微软Copilot的竞争,以及微软探索替代模型上。对OpenAI而言,失去微软的算力资源可能延缓其AGI目标,特别是在面临2025年预计50亿美元亏损的情况下。OpenAI与甲骨文和CoreWeave的合作,以及微软对Phi-4的投资,表明双方都在为独立未来做准备。
2025-05-03 20:55:53
1165
原创 如何使用Ollama在本地运行Qwen3并支持MCP和工具使用
将Qwen3与Qwen-Agent、MCP和Ollama结合使用,可以得到一个不依赖任何外部云服务的本地AI助手。您可以运行多轮对话,启用实时信息检索,并执行Python代码——全部在本地基础设施内完成。这使其成为开发人员、研究人员和产品团队的理想设置,特别是那些关注隐私、灵活性和可扩展性的人。随着Qwen3的不断发展,我们可以期待其对复杂任务的更强大支持和与自定义工具的无缝集成,为真正自主的本地AI代理铺平道路。
2025-05-03 02:13:30
200
原创 如何免费使用 DeepSeek-Prover-V2?
DeepSeek Prover V2在使符号推理变得易于访问和自动化方面迈出了一大步。对教育、辅导或研究非常有用。你可以将其扩展到证明、定理、逻辑谜题等更多领域。你甚至可以在官方页面的 HuggingFace 推理部分免费试用该模型。希望你能尝试这个模型。
2025-05-01 20:24:52
196
原创 免费在Colab运行Qwen3-0.6B——轻量高性能实战
Qwen3-0.6B证明了较小的模型正变得更加智能。它在其规模内表现出色,可以轻松在Colab上运行,并且采用开放使用许可。朋友可以尝试下。
2025-04-30 18:57:35
162
原创 Context7 MCP:提供实时、版本特定的文档以解决AI幻觉问题
Context7代表了编码辅助工具的新方向,通过实时上下文信息增强开发效率。它有效解决了AI编码助手最大的痛点——版本不匹配导致的API错误。未来随着更多团队采用MCP服务器和llms.txt标准,基于上下文的智能编码体验将成为开发新常态。
2025-04-28 23:53:43
143
原创 DeepWiki:AI深度搜索3万个代码库
DeepWiki代表了利用AI进行代码库理解的重大进步。通过自动生成文档并提供交互式探索工具,它降低了理解复杂软件项目的障碍。其技术基础,结合代码分析与先进的LLM,为开发者生产力、入职培训和对开源生态系统的贡献提供了切实的好处。
2025-04-27 23:46:36
48
原创 开源AI视频FramePack发布:6GB显卡本地运行
我们现在处于这样一个时代:您 — 在家中,使用中端GPU — 可以制作AI电影。无需订阅。无标记。无限制。FramePack是一个开放的创意沙盒。无论您喜欢动漫、模因、短片、讲故事还是实验,它都能让您完全掌控。而且是免费的。如果您关心AI内容创作开源工具或本地生成AI视频, 可以尝试下。
2025-04-26 23:00:09
1167
原创 OpenAI 最新 o3 集成到 Cursor 和 Cline 工作流程中
绝对值得。将o3集成到Cursor和Cline中明显增强了编码体验。Cursor凭借其原生支持提供了最简便的路径,使其成为交互式AI辅助的绝佳工具。Cline提供了对更自主、Agent驱动开发的一瞥,尽管目前通过OpenRouter为o3设置略微复杂。关键是了解每个工具的优势并相应地调整你的提示。无论是生成样板代码、调试棘手的逻辑还是自动化多步骤任务,o3都提供了强大的推理引擎。既然你已经了解了设置和潜力,你会首先构建什么?深入探索,实验,看看o3如何改变你的工作流程。
2025-04-25 19:32:31
136
1
原创 Dia-1.6B TTS: 最佳文本对话生成AI模型
现在我们有了一个新模型Dia-1.6B,它在会话式AI方面似乎比ElevenLabs和Sesame CSM 1B模型表现更好。,意味着用户可以通过提供参考音频片段来引导模型输出,影响说话者的情感表达和语调。虽然Sesame和ElevenLabs在TTS质量方面设定了高标准,但DIA的。方面表现更好,特别是在对话密集的场景中。与传统的产生僵硬或单调语音的TTS系统不同,DIA擅长捕捉。等模型所缺乏的能力,后者需要手动替换(例如"哈哈")。另外,如果你不想在本地运行,可以在这里尝试。,如笑声、咳嗽和清嗓子。
2025-04-24 20:48:26
504
原创 OpenAI 宣布有意收购 Google Chrome
虽然 Chrome 已向超过 40 亿用户免费提供,占全球浏览器市场的 67%,但这种免费分发是由谷歌的广告收入资助的,而法官声称由于公司的垄断地位,这些广告收入过高。当被问及此事时,OpenAI 的 Turley 指出,虽然该公司目前使用微软 Bing 的搜索数据,但它希望获得更多搜索数据,包括来自谷歌的数据。虽然谷歌和 OpenAI 目前不是合作伙伴,但 Turley 表示,强制共享谷歌的搜索数据可能有助于恢复市场中的健康竞争。谷歌还拥有领先的网络浏览器 Chrome,谷歌搜索在其中作为默认搜索引擎。
2025-04-23 22:06:33
279
原创 从零到多智能体:Google Agent开发套件(ADK)入门指南
ADK促进自定义工具生产的能力是其优势之一。本质上,工具只是一个带有描述性文档字符串的Python函数。
2025-04-22 23:33:57
469
1
原创 Qwen-Chat与谷歌Veo2在免费AI视频方面对比
就在几天前,谷歌宣布了一项令人惊讶的举措,在AI Studio平台上向所有用户免费开放他们最先进的AI视频生成模型Veo2。为了与之竞争,Qwen团队也发布了Qwen 2.5 Max,现在可以在他们的Qwen Chat平台上免费且无限制地生成AI视频。我测试了这两个视频生成平台,以下是我的发现:谷歌AI Studio的Veo2每个账户每天只提供两次生成机会。而在Qwen聊天平台上,我生成了4到5个视频都没有遇到任何限制。因此,在免费使用方面,Qwen聊天平台任何时候都比谷歌Veo2更具优势。
2025-04-21 23:24:15
455
原创 开源项目FastAPI-MCP:一键API转换MCP服务
FastAPI MCP是一个零配置工具,可自动将您的FastAPI端点作为模型上下文协议(MCP)工具暴露出来。FastAPI MCP的优点在于其简洁性 — 它接管您现有的API端点并使其对AI模型可访问,而无需您重写代码或创建单独的实现。使用FastAPI MCP,您可以:自动将FastAPI端点转换为MCP工具保留您的API架构和文档将MCP服务器与您的API一起部署或作为单独的服务自定义哪些端点作为工具暴露控制如何生成工具描述。
2025-04-20 23:04:06
586
原创 免费将AI生成图像放大4倍的方法
这会导致很多不同的问题,特别是对于那些想要在内容或项目中使用这些图像的人,寻找商业许可内容用于广告目的的企业,甚至是销售AI内容的个人。当然不是,但对于任何想要一个完全快速、简单且免费的解决方案来提升AI图像分辨率的人来说,这是理想的选择。4x-AnimeSharp.pth:如果你创建AI生成的动漫内容,你可以使用这个放大器获得更好的效果。如果你发现了使用任何工具提升图像分辨率的基本且简单的方法,请随时在评论区分享,帮助其他人。下载我创建的这个简单且免费的工作流程,下载完成后,只需。
2025-04-19 22:16:19
1018
原创 从PDF到播客:MIT开发的超越NotebookLM的工具
使用Hugging Face空间,你不必担心这个问题——因为它是一个Gradio应用,它会自动为你在Hugging Face上创建(或本地运行)的任何空间提供API。NotebookLM是一项令人兴奋的技术,它已经激发了开源社区和许多项目——不仅仅是这一个——将潜在的难懂文本转化为更具吸引力的格式,使即使是最困难的主题也比以往任何时候都更容易理解,而这仅仅是个开始。为了了解推理和TTS的成本有多实惠,在我在此分享的实验中,我制作了一个关于技术趋势报告的播客,大约有50页,生成了15分钟的播客。
2025-04-18 19:45:22
304
原创 读完谷歌69页提示工程白皮书后的5个核心要点
谷歌这份白皮书不仅是学术探讨,更是一份行动倡议。提示词工程代表着未来,掌握它的人将成为时代的赢家。是时候停止将AI视为黑箱,而应将其视为我们最强大的合作伙伴了。
2025-04-17 22:01:05
1133
2
原创 免费使用RooCode + Boomerang AI + Gemini 2.5 Pro开发套件
截至2025年4月,这套「RooCode+Boomerang+Gemini 2.5 Pro」组合提供了惊艳的智能开发体验,关键是完全免费!它能:✔️ 自动处理重复性工作✔️ 加速开发流程✔️ 替代日费高达$150的商用AI工具。
2025-04-16 21:32:57
189
原创 OpenAI发布GPT-4.1系列模型——开发者可免费使用
OpenAI刚刚推出GPT-4.1模型家族,包含GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano三款模型。重点是——现在全部免费开放!虽然技术升级值得关注,但真正具有变革意义的是开发者能通过Cursor、Windsurf和GitHub Copilot等平台立即免费调用这些模型。开发者朋友们,现在就去体验吧!
2025-04-15 22:28:50
704
1
原创 谷歌A2A与Anthropic MCP: AI 智能体互补双协议
当 AI Agents 开始说"同一种语言",世界将发生何种巨变?近日,谷歌宣布开放Agent2Agent(A2A)协议,在社交媒体上引发轩然大波。A2A代码实践阅读上篇文章。但在炒作背后,隐藏着一个关于技术协同的精彩故事——看似竞争的两种协议实则形成了强大的互补。让我们解码这场技术变革的深层逻辑。
2025-04-14 21:58:54
93
原创 谷歌A2A协议入门指南:附简易Python代码示例
继"关税"之后,当下最热门的词汇当属AI智能体——这种基于人工智能的软件能够执行复杂任务、实现工作流自动化并提升生产效率。但迄今为止,大多数智能体都处于各自为政的状态,难以顺畅协作。就像团队执行重大项目时,成员之间却无法交流!对于技术人员而言,一个可能遇到的典型场景是:假设你需要协调四个不同的AI服务——处理用户查询的Gemini智能体、在向量数据库进行搜索的AI应用、基于Claude的摘要生成器,以及运行专业领域逻辑的Python智能体。
2025-04-13 21:28:51
122
原创 开源Cursor替代品——Void
我原先写过很多关于Cursor文章。今天分享一个开源的 Cursor 替代方案。如果你也热爱开源项目,那么这篇文章正是为你准备的!
2025-04-11 21:03:06
392
原创 谷歌推出可免费使用的Firebase Studio:Gemini全栈AI开发利器
🔥 谷歌Firebase Studio:用AI写代码!用自然语言+60多个模板+Gemini构建应用,完全免费,浏览器即可使用。现已开放抢先体验!
2025-04-10 23:39:01
466
原创 我是如何免费获取Cursor Pro的操作教程
我是个爱钻研技巧的抠门程序员,所以当我发现能不花一分钱搞到Cursor Pro时,简直乐疯了。这款高端代码编辑器我眼馋了好久,而这个妙招在我的Windows系统上完美奏效。虽然不是什么技术大神——不过是个写了十多年代码文章的普通码农——我会用最简单的方式说清楚。
2025-04-10 00:24:56
571
原创 GPT-5、o3和o4-mini即将到来
*推理模型世代(o1/o3/o4)的更新周期不再是基础模型(GPT-2/3/4/5)的18-24个月,而是3-4个月——提速达6倍。即将推出的o4-mini在性能上可能与o3相近,但将突破这些限制,让全球用户——甚至免费用户(尽管会有速率限制)——都能用上世界顶级AI研究助手。若GPT-5真如所言"远超我们最初设想"——我个人对此深信不疑——这将直接击穿质疑者的论调,无论是"算力缩放瓶颈无法通过测试阶段计算解决",还是"OpenAI迟迟不推GPT-5必因未达预期"之类的说辞。首先,基准测试结果不佳。
2025-04-08 21:45:55
949
1
原创 如何免费使用Meta Llama 4?
作为开源模型,Llama 4存在一个重大限制——庞大的体积。该系列最小的Llama 4 Scout模型就拥有1090亿参数,如此庞大的规模根本无法在本地系统运行。如果你拥有足够强的显卡,还可以下载完整模型权重——本篇指南将为你详解所有获取方式。Hugging Face平台提供了多种精度的Llama4模型(如FP8等),适合开发者使用。OpenRouter.ai 提供免费的 Llama 4 模型 API 访问权限。:适合需要快速集成 Llama 4 API 的开发者或想免费体验最新模型的用户。
2025-04-07 21:34:34
282
hadoop-2.6.1.zip
2020-06-16
plsql developer 11.zip
2019-07-22
《Spark GraphX实战》_时金魁.pdf
2019-06-30
自定义rpc框架
2018-09-29
大数据时代总结
2018-08-05
数学分析三大基本思想之分解
2018-08-05
数学分析三大基本思想之逼近
2018-08-05
js通用方法
2018-04-01
redis详细笔记
2016-10-04
推荐:数据中台-协作流程
2021-08-30
TA创建的收藏夹 TA关注的收藏夹
TA关注的人