AI Agent
文章平均质量分 90
智能体(AI Agent)理论与开发实践
guopeiAI
曾任小米AI Lab图像算法工程师, 现任国内知名公司算法专家, 微信号:guopeiAI
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
智能体(AI Agent)开发指南
《智能体开发指南》是一份基于国产大模型与火山引擎的入门教程,完整介绍从环境配置到实战案例的智能体开发全流程。内容涵盖大模型接入、MCP构建、RAG、ReAct等核心技术,以及Coze平台实践和LangChain应用。教程特别适合国内开发者,无需翻墙即可快速上手。通过12个由浅入深的章节,帮助读者掌握智能体开发核心技能,并附有本地部署框架deer-flow的实践指南。文档最后鼓励开发者持续学习,共同推动国产AI生态发展。原创 2025-09-03 08:50:52 · 639 阅读 · 0 评论
-
用嘴剪视频的时代来了!html-video粘个链接自动生成带动画 MP4,14 种 AI Agent 随你挑
「HTML-Video」是一款开源的AI视频生成工具,通过粘贴链接或GitHub仓库即可自动生成带动画的MP4视频。它支持14种AI Agent和21套精选模板,采用本地无头Chromium+ffmpeg渲染,完全开源且无需云端依赖。核心优势在于将HTML转换为视频的自动化流程,支持网页文章、GitHub仓库和自然语言描述三种输入方式,并能自动编排内容、选择模板、生成多帧动画。项目采用Apache 2.0许可证,适合需要快速制作产品宣传、数据可视化等视频的场景,大幅降低了视频制作门槛。(149字)原创 2026-06-08 15:06:24 · 557 阅读 · 0 评论 -
美团开源 136 亿参数视频生成大模型!生成分钟级长视频不崩不糊,MIT 协议商用无忧
LongCat-Video 是美团 LongCat 团队交出的一份重量级开源答卷🏗️统一架构:T2V + I2V + 视频续写,一个模型全搞定🎬分钟级长视频:原生预训练续写,无色偏无画质退化⚡高效推理🏆性能对标商业方案:MOS 综合 3.38,反超 Wan 2.2(3.35),持平 PixVerse-V5(3.36)🧑:Whisper 编码器 + 蒸馏加速 + INT8 量化 + 风格泛化📜MIT 协议:模型权重也是 MIT,商用无忧推荐指数:⭐⭐⭐⭐⭐。原创 2026-06-06 21:39:38 · 418 阅读 · 0 评论 -
从零搭建实时数字人!LiveTalking一行命令启动,3060 显卡 60 帧丝滑对话,商用级开源方案
摘要:LiveTalking是一款开源商用级实时数字人解决方案,支持音视频同步对话、打断重说、声音克隆等功能,RTX 3060显卡即可实现60帧流畅运行。相比商业方案,它具有Apache 2.0开源许可、低延迟、多模型支持等优势,适用于直播、客服、教育等场景。用户可通过5步快速部署:克隆代码、安装环境、下载模型、启动服务、浏览器访问。系统采用四层架构,支持插件扩展,提供多种推流协议和API接口,并已通过商业验证。原创 2026-06-06 21:23:30 · 268 阅读 · 0 评论 -
太强了!清华开源的 Agent 操作系统,让 AI 记忆白盒可追溯,Token 成本直降 5 倍!
清华大学与面壁智能联合开源的PilotDeck是一款革命性的AI Agent操作系统,通过三大核心技术突破行业瓶颈:1)WorkSpace隔离机制实现多任务并行且记忆不污染;2)白盒记忆系统使AI记忆全程可追溯、可修改;3)智能路由技术根据不同任务难度自动分配模型,实测可降低5倍Token成本。该系统支持端侧运行,提供一键安装和Docker部署方案,适用于长周期、多项目并行的生产力场景,让AI在用户离线后仍能持续工作并生成汇报。开源地址:https://github.com/OpenBMB/PilotDec原创 2026-06-06 20:16:51 · 219 阅读 · 0 评论 -
Codex++ 来了!让 OpenAI Codex 更好用的增强神器,插件解锁+中转注入全搞定
Codex++ 是 OpenAI Codex App 的增强工具,通过外部注入方式提供多项实用功能,无需修改原始文件。主要特点包括:解锁插件入口、支持中转 API 注入、新增会话删除功能、Markdown 导出、项目移动等。工具采用双入口设计(静默启动器+Tauri管理面板),通过 Chromium DevTools Protocol 实现安全注入,支持多配置切换和自动更新。适用于 Windows 和 macOS 平台,特别适合需要灵活使用中转 API 或增强 Codex 功能的开发者。项目地址:https原创 2026-06-01 15:00:19 · 3380 阅读 · 0 评论 -
不用 Visio 不用 draw.io!Architecture Diagram Generato用 Claude 一句话生成专业架构图,暗黑主题太酷了
这篇文章介绍了一个名为Architecture Diagram Generator的开源工具,它能通过自然语言描述自动生成专业架构图,主要特点包括: 一键生成:只需用自然语言描述系统架构,Claude AI即可自动生成专业级暗黑主题架构图 便捷导出:支持导出PNG/PDF格式,生成的独立HTML文件无需额外依赖 智能设计:采用语义配色系统(前端蓝/后端绿/数据库紫等)、智能布局和等宽字体 高效迭代:支持对话式修改,无需重新绘制 多场景适用:支持Web应用、微服务、云服务等多种架构类型 该工具基于Claude原创 2026-06-01 14:43:27 · 263 阅读 · 0 评论 -
太强了!OpenMontage:12 条管线、52 个工具、500+ Agent 技能,把 AI 编码助手变成视频工作室
OpenMontage 是一个革命性的 AI 视频创作框架,能将编码助手转变为全功能视频工作室。它通过 12 条生产线、52 个专业工具和 500+ Agent 技能,实现从调研到成片的端到端自动化制作。相比当前 AI 视频工具的局限性(短片段、无故事性、缺乏参考等),OpenMontage 支持参考视频驱动、真实素材剪辑、内置网络调研和成本治理等核心能力。系统采用独特的 Agent-First 架构,以 AI 编码助手为编排器,遵循 7 阶段标准化流水线(调研→提案→剧本→分镜→素材→剪辑→合成),支持无原创 2026-06-01 14:28:26 · 409 阅读 · 0 评论 -
一句话生成完整视频!ViMax:导演+编剧+制片人+视频生成 All-in-One 的多智能体框架
ViMax:全自动AI视频生成多智能体框架原创 2026-06-01 14:09:41 · 442 阅读 · 0 评论 -
受够了 AI 生成的丑界面?Taste Skill 让你的 AI 终于有了“审美“
文章摘要 Taste Skill 是一款专为AI编码助手设计的技能插件,旨在解决AI生成界面普遍存在的"AI审美"问题(如紫色渐变、居中布局等)。它提供三旋钮系统(设计变化度/动效强度/视觉密度)精确控制输出风格,内置反AI味规则清单禁止常见模板化设计,并支持自动匹配主流设计系统(Material/Fluent等)。核心功能包括智能需求推断、设计系统映射、暗色模式支持、组件库标准化和发货前检查清单。安装简单,支持10种风格变体,可显著提升AI生成界面的专业性和独特性。项目开源,适用于React/Vue/Sv原创 2026-06-01 12:55:36 · 473 阅读 · 0 评论 -
开源炸裂!输入网址秒出 React 代码,Open Lovable 让你 10 秒克隆任意网站
摘要: Open Lovable 是一款开源工具,输入网址即可自动生成 React 代码,实现网站秒级克隆。支持 8 种 UI 风格切换(如玻璃拟态、暗黑模式等),集成 GPT-5、Claude 等主流大模型,通过 Firecrawl 爬取网页内容并结构化,AI 生成可运行的 React 项目。还提供品牌风格扩展、实时沙箱预览等功能,适合快速原型设计、学习或竞品分析。需配置 API 密钥,依赖 Firecrawl 爬虫服务,技术栈基于 Next.js 15 和 Tailwind。 核心亮点: 🔥 输入 U原创 2026-06-01 09:18:34 · 434 阅读 · 0 评论 -
太强了!VoltAgent:用 TypeScript 打造生产级 AI Agent 的全栈开源框架
VoltAgent 是一个全栈开源的 TypeScript AI Agent 开发框架,提供从开发到运营的一站式解决方案。核心功能包括: 完整运行时 - 集成记忆管理、RAG检索、安全护栏、多工具调用等核心能力 工作流引擎 - 声明式多步骤自动化,支持人机协同(Human-in-the-Loop) Supervisor模式 - 主Agent协调多个专业子Agent的团队协作 生产级特性 - 持久化记忆、断线恢复、语音交互、内容安全护栏等 可视化运维 - 通过VoltOps Console实现实时监控、性能分原创 2026-06-01 09:10:02 · 590 阅读 · 0 评论 -
20 万行代码看一眼就懂!Understand Anything这个开源知识图谱插件让 AI Agent 帮你秒懂任何代码库——15 个平台一键安装
Understand Anything 是一个Claude Code 插件,用多 Agent 流水线分析项目,构建知识图谱,提供交互式可视化 Dashboard 来探索代码库。把任何代码库/知识库/文档变成可交互的知识图谱——Tree-sitter 确定性解析 + LLM 语义理解双引擎,7 Agent 流水线,15 平台一键安装,增量更新,团队共享。📜 开源协议:MIT License👤 作者:Lum1104免费(MIT 开源)是目前最好的代码库知识图谱工具核心优势说明🕸️三大视图。原创 2026-05-29 14:13:36 · 1273 阅读 · 0 评论 -
AAnthropic 团队都改用 HTML 写文档了!HTML Anything这个开源项目让 AI gent 一键生成 75 种精美排版——微信/X/知乎一键导出
Anthropic团队宣布改用HTML撰写文档,认为HTML比Markdown更利于读者阅读。为此,开源项目HTML Anything应运而生,它能通过AI Agent将Markdown/CSV/JSON等格式内容一键转换为精美排版的单文件HTML,支持75种模板和9种输出形态(如文章、幻灯片、海报等)。该项目无需API密钥,自动检测8种编程助手,可一键导出至微信/X/知乎等平台,由Open Design团队开发并开源。核心优势包括流式渲染、沙箱预览和格式自动检测,30秒即可快速上手,适合需要高效内容发布的原创 2026-05-29 13:14:03 · 425 阅读 · 0 评论 -
不用每月花 29 刀!OpenScreen这个开源屏幕录制神器让你 0 成本做出 Screen Studio 级产品演示视频
OpenScreen是一款免费开源的屏幕录制工具,可作为Screen Studio的平替方案。它具备录制窗口/区域/全屏、麦克风+系统音频采集、摄像头画中画等核心功能,支持自动缩放+运动模糊特效,提供多种精美背景模板,能通过模糊效果遮挡敏感信息,还具有光标高亮、文字/箭头标注、时间线剪辑等实用特性。支持导出MP4/GIF多种格式和比例,跨平台兼容macOS/Windows/Linux,采用MIT开源协议,个人和商业用途均可免费使用。相比Screen Studio每月29美元的费用,OpenScreen以零成原创 2026-05-29 12:55:11 · 394 阅读 · 0 评论 -
GreenSock 官方出手了!8 个 AI Skill 让你的 Agent 秒变 GSAP 动画大师——核心 API、ScrollTrigger、Flip、SplitText 全免费
文章摘要 GreenSock 官方发布了 8 个 AI Skill,帮助开发者通过 AI Agent 正确使用 GSAP 动画库。这些技能包覆盖核心 API、Timeline 编排、ScrollTrigger 滚动动画、Flip 布局动画等关键功能,解决了 AI 生成代码中常见的过时 API、误用 CSS 动画等问题。特别值得注意的是,自 Webflow 收购 GSAP 后,所有插件(包括之前付费的 SplitText、MorphSVG)现已完全免费,无需认证令牌。开发者只需 npm install gsa原创 2026-05-29 11:29:19 · 943 阅读 · 0 评论 -
不用注册、不用联网!Oh My PPT这个开源 AI PPT 工具一句话出整套幻灯片,30+ 风格任意选还能对话改
文章摘要 Oh My PPT 是一款开源本地化 AI PPT 工具,支持一句话生成完整幻灯片,30+风格可选,无需注册和联网。核心特性包括:四种创作方式(对话/文档/模板/图片识别)、可视化编辑、动画系统、字体管理、演讲稿生成等。采用HTML格式,支持导出PDF/PNG/PPTX,还能打包成单文件。基于Electron+React+TypeScript开发,MIT协议开源,保障数据隐私,适合商务汇报、教学演示等场景。解决了传统AI PPT工具格式固定、修改困难的问题,提供更灵活的本地化编辑体验。 (149字原创 2026-05-29 11:06:58 · 318 阅读 · 0 评论 -
阿里开源 Agent 框架大升级!AgentScope 2.0 来了——事件流、权限系统、沙箱工作区、人机协作一个不少
阿里开源Agent框架AgentScope 2.0发布,带来六大核心升级: 事件流系统:支持类型化事件流,实现实时监控与流式UI 三层权限引擎:内置危险路径保护,提供5种权限模式,Deny规则无法绕过 沙箱工作区:支持本地/Docker/E2B一键切换,增强隔离性 人机协作:关键操作需人工确认,支持暂停/恢复机制 高效执行:工具并发调用+自动上下文压缩,优化长对话处理 Agent服务:内置多租户支持,开箱即用的REST+SSE服务 该框架采用"充分发挥模型能力"的设计哲学,不限制Agent工作流范式,5分钟原创 2026-05-29 10:49:53 · 1432 阅读 · 0 评论 -
OpenAI 官方出品!不再盯着 AI 写代码,让 Agent 自己领任务干活——Symphony 彻底改变人机协作模式
OpenAI推出的Symphony项目彻底改变了人机协作模式,让AI Agent自主完成编码任务。工程师只需审查结果,不再需要手动操作AI。该项目源自OpenAI内部实验:3名工程师5个月内通过Codex生成了100万行代码。Symphony核心架构包含8大组件,通过WORKFLOW.md文件定义工作流程,实现任务自动领取、独立工作区创建、代码编写和PR提交的全流程自动化。这一创新将工程师角色从"AI操作员"转变为工作管理者,大幅提升开发效率。原创 2026-05-23 11:55:16 · 338 阅读 · 0 评论 -
复制一个 Markdown 文件,AI 就能还原 Apple/Stripe/SpaceX 的 UI!73 个品牌设计系统免费白嫖
这篇文章介绍了Awesome DESIGN.md项目,这是一个包含73个全球顶级品牌设计系统的开源资源库。该项目通过简单的Markdown文件格式,为AI提供精确的设计规范,解决AI生成UI时"差不多"的问题。 核心亮点包括: 采用Google Stitch提出的DESIGN.md概念,纯文本格式便于AI直接读取 覆盖AI平台、开发者工具、金融科技、电商零售等多个领域的知名品牌 每个DESIGN.md文件包含完整的视觉特征:颜色、字体、间距、组件等设计规范 与传统设计系统相比,无需转换格式,任何文本编辑器都原创 2026-05-23 11:41:32 · 362 阅读 · 0 评论 -
被马斯克点赞的 AI Agent 框架!5 行代码部署 24/7 自动化工作团队,PraisonAI 把多 Agent 开发降维打击了
入门简单,做起来难。写一个单 Agent 的 Hello World 只需 3 行代码,但一进入多 Agent 协作、工具集成、生产部署,代码量就指数级膨胀。PraisonAI5 行代码,从单 Agent 到整支 AI 工作团队。更让人惊叹的是,这个项目被——Musk 发推提到 “Grok 3 customer support”,引用的正是 PraisonAI 的教程。5 行代码部署 24/7 AI 自动化团队——研究、规划、编码、执行,自带记忆和 RAG,支持 100+ LLM。📜 开源协议:MIT。原创 2026-05-23 11:28:35 · 492 阅读 · 0 评论 -
Beautiful HTML Templates:34 套精心打磨的 HTML 幻灯片模板,一行命令让 AI Agent 自动帮你做出惊艳 PPT!
这篇文章介绍了一个创新的HTML幻灯片模板库"Beautiful HTML Templates",包含34套精心设计的模板,通过AI Agent实现智能匹配和自动排版。主要特点包括: 采用Tone-First Matching理念,通过8维元数据标签(情感、场景、风格等)智能匹配模板 模板分为四大风格:编辑杂志风、温暖自然风、活泼趣味风和专业商务风 每套模板包含完整的前端代码和元数据,支持AI Agent自动克隆和内容替换 独特的"感觉优先"设计哲学,打破传统按行业分类的模式 适用于各类演示场景,从商务报告原创 2026-05-23 11:13:38 · 959 阅读 · 0 评论 -
不会 CSS 也能做出惊艳 PPT!Frontend Slides这个开源 Claude Code 技能让 AI 帮你生成 12 种风格演示文稿,告别千篇一律的紫渐变
做演示文稿这件事,长期以来只有两条路:要么用 PowerPoint/Keynote 拖拽排版,要么用 reveal.js/Slidev 写代码。前者费时费力还容易做得丑,后者门槛高且调试痛苦。给出了第三条路——让 AI 帮你做,你只需要"看"和"选"。它是一个 Claude Code 技能(Skill),专门用来创建动画丰富的 HTML 演示文稿。最妙的是它的""理念:不需要你用语言描述"我想要什么风格",而是直接生成 3 种视觉预览让你对比选择——看一眼胜过千言万语。原创 2026-05-22 15:58:50 · 866 阅读 · 0 评论 -
20 年磨一剑的开源视频编辑器!免费、跨平台、4K/8K、10-bit 色彩,Shotcut 凭什么和 Premiere 正面硬刚?
Shotcut是一款免费开源的专业级视频编辑器,经过20年持续迭代已发展成熟。核心优势包括:永久免费开源、真正跨平台支持、无需导入直接编辑、专业监看支持和4K/8K分辨率处理能力。功能方面提供多轨道时间线编辑、丰富的视频滤镜(含10-bit色彩管线)、专业音频处理、语音转文字、字幕工具等。基于MLT框架和FFmpeg等技术栈,支持多种硬件加速。最新v26.4版本新增GPU加速语音转文字、任务栏进度显示和LUT文件支持等功能。作为一款功能全面且无商业限制的开源软件,Shotcut为视频创作者提供了专业级Pre原创 2026-05-22 15:47:17 · 193 阅读 · 0 评论 -
6 万字、2 年迭代、一人企业方法论 :不融资、不内卷,一个人也能赚到钱的完整路线图
《一人企业方法论》是一套面向独立开发者和创业者的6万字实践指南,提出了不融资、不内卷的个人创业路径。核心内容包括四大模块:定义一人企业(区别于个体户和创业公司)、规划策略(聚焦小众刚需赛道)、业务构建(从副业验证开始)和基础设施搭建(自建可控技术栈)。最新2.1版本新增了AI Agent技能集,提供9个自动化工具辅助商业分析、产品设计和运营复盘。该方法论强调通过认知差和资产杠杆实现"小而美"的商业模式,特别适合数字产品、在线服务等轻资产领域,帮助个人以极低成本启动可持续的被动收入业务。原创 2026-05-22 14:55:59 · 415 阅读 · 0 评论 -
13 万行代码,开源干翻剪映!OpenReel浏览器里做专业视频剪辑,4K 不卡、视频不上传、永久免费
剪映越来越贵、Premiere 太重、DaVinci 太专业、在线编辑器要上传视频到云端。你想要的其实很简单——一个够专业、够快、够安全、不要钱的剪辑工具。就是这个答案。它是开源界的剪映替代品,一个完全在浏览器中运行的专业视频编辑器,不需要安装任何软件,不需要上传视频,不需要付费订阅。浏览器里跑的 DaVinci Resolve——开源、免费、隐私、GPU 加速。📜 开源协议:MIT📊 代码规模:130,000+ 行。原创 2026-05-22 14:43:53 · 575 阅读 · 0 评论 -
baoyu-skills:24 个 AI Agent 技能包一键安装!小红书配图、信息图、SVG 架构图、PPT 幻灯片全搞定
AI视觉创作工具包baoyu-skills为AI Agent提供24种视觉创作技能,涵盖内容生成、AI图片创作和实用工具三大类。核心功能包括:一键生成小红书卡片(12种风格×6种布局)、专业信息图(20种布局×17种风格)、SVG架构图(5种图表类型)以及PPT幻灯片等。该工具包支持Node.js环境,采用MIT-0开源协议,能显著提升AI在视觉内容创作方面的能力,实现从文案到出图的全流程自动化。原创 2026-05-22 14:19:07 · 917 阅读 · 0 评论 -
一行命令让 AI 掌控 Word/Excel/PPT!OfficeCLI这个开源项目把 Office 自动化玩出了新高度
OfficeCLI 是一个革命性的开源工具,专为AI Agent设计的Office自动化解决方案。它通过单一命令行接口实现了对Word、Excel和PPT的完整控制,无需安装Office软件或编写复杂代码。该项目采用.NET技术栈,提供创建、读取、修改文档等核心功能,支持实时预览和结构化JSON输出。相比传统python-pptx等库需要数十行代码的操作,OfficeCLI只需一行命令即可完成,极大简化了AI操作Office文档的流程。其独特的内置渲染引擎让AI能"看到"文档效果,解决了传统自动化工具"盲操原创 2026-05-22 13:02:08 · 771 阅读 · 0 评论 -
Claude Code 每次重开都失忆?claude-mem一行命令给它装上“长期记忆“,再也不用重复解释项目了
用 Claude Code 的朋友一定有过这种痛苦体验——每次开新会话,AI 就像失忆了一样。你精心解释过的项目架构、踩过的坑、做过的技术决策,全都烟消云散。你得从头再来一遍。claude-mem就是来终结这个痛点的。它是一个为 Claude Code 打造的持久化记忆压缩系统,能自动捕获 Agent 在会话中的工具使用行为,生成语义摘要,并在未来会话中智能注入相关上下文。你的 AI 终于能"记住"之前做过什么了。给 AI Agent 装上长期记忆,让上下文跨会话存活。原创 2026-05-22 09:39:13 · 850 阅读 · 0 评论 -
两周狂揽 40k Star!Open Design这个开源项目正在颠覆 AI 设计,Claude Design 的最强替代品来了
这篇文章介绍了一个名为Open Design的开源AI设计工具,它作为Claude Design的替代品,在两周内获得了40k+的Star。以下是关键要点: 核心优势:开源、本地运行、支持16种AI Agent和31个可组合技能,完全免费 主要功能: 129套品牌设计系统 多媒体生成能力(图片/视频/动效) 5种视觉风格预设 支持多种导出格式(HTML/PDF/PPTX等) 技术特点: 采用Next.js + Express + Electron技术栈 本地SQLite存储 支持Claude Design项原创 2026-05-22 09:29:45 · 555 阅读 · 0 评论 -
太强了!用自然语言写 PPT,AI 帮你搞定一切——open-slide 开源项目全解析
open-slide:AI驱动的幻灯片框架革新 摘要:open-slide是一款创新的开源幻灯片框架,通过AI编码助手实现自然语言生成专业PPT。用户只需描述需求,AI即可自动编写React代码生成幻灯片,支持1920×1080固定画布、任意React组件、浏览器内审查修改、演讲者模式等功能。项目采用pnpm+Turbo架构,内置/create-slide和/slide-authoring技能,实现评论驱动的快速迭代。相比传统PPT工具,open-slide在技术分享、产品演示等场景下效率更高,但需要基本的原创 2026-05-22 09:18:27 · 879 阅读 · 0 评论 -
太强了!NarratoAI:一键 AI 影视解说+自动剪辑,10分钟视频成本仅0.1元
NarratoAI 是目前 GitHub 上少有的AI 影视解说+自动化剪辑一站式工具,它将视觉理解、文案生成、TTS 配音、自动剪辑四大环节串联成完整流水线,让影视解说从"手工活"变成"流水线"。对于想要快速批量产出影视解说内容的朋友来说,NarratoAI 绝对值得一试。搭配硅基流动等低成本 API 平台,一条 10 分钟的解说视频成本可能还不到一毛钱。🔥推荐指数:⭐⭐⭐⭐(4/5)扣一分是因为自动剪辑精细度还有提升空间,但整体完成度和更新节奏在同类项目中表现优秀。原创 2026-05-07 09:08:47 · 767 阅读 · 0 评论 -
终于有人认真做 AI 生成 PPT 了!输出的不是图片,是真正可编辑的 PPTX
PPT Master 是目前唯一一个认真做"AI 生成真正可编辑 PPT"的开源项目。它的核心理念很简单——打不开编辑的文件不配叫 PPT。在这个理念下,它用 DrawingML 原生输出、模板复刻、原生动画、旁白配音、语音克隆、视频导出一整套能力,覆盖了从内容生成到最终交付的完整链路。加上开源免费、数据本地、无平台锁定、模型任选的设计哲学,它不只是又一个 AI PPT 工具,而是一个真正站在用户立场上的生产力方案。🌟推荐指数:⭐⭐⭐⭐⭐。原创 2026-05-06 19:33:33 · 954 阅读 · 0 评论 -
告别手动画图!用自然语言秒出出版级技术架构图,7 种风格任意选
告别手动画图!这个开源项目让你用自然语言描述系统,即可自动生成7种风格的高清技术架构图(SVG+PNG)。支持14种UML图类型,特别优化AI/Agent领域,提供语义形状和箭头系统,内置40+产品图标。相比Mermaid和draw.io,它能实现"描述即出图",无需学习语法或手动调整样式,大幅提升架构图制作效率。安装简单,支持中英文输入,是技术文档、博客和演示文稿的理想工具。原创 2026-05-06 19:27:21 · 581 阅读 · 0 评论 -
一键把论文变成精美 PPT!paper2slides这个开源神器让学术汇报再也不用熬夜做幻灯片
一键生成学术PPT的开源神器Paper原创 2026-05-06 19:13:29 · 523 阅读 · 0 评论 -
太方便了!一个 App 统管 15+ AI 编程工具的 Skills,再也不用来回折腾了
摘要: Skills Manager 是一款轻量级桌面应用,帮助开发者统一管理 15+ AI 编程工具(如 Cursor、Claude Code、Copilot 等)的 Skills。通过集中存储、场景切换和批量同步功能,解决多工具 Skills 配置混乱的问题。支持从 Git/本地/市场安装 Skills,提供 AI 搜索、标签分类、Git 备份及项目级管理,实现跨工具、跨设备的无缝工作流切换。基于 Tauri 2 + Rust 构建,具有高性能和低资源占用特点,适合团队协作及多场景开发者使用。 核心功能原创 2026-05-06 17:39:49 · 454 阅读 · 0 评论 -
GitHub Trending 第一!一个周末精通 Claude Code,这个开源指南让我少走了半年弯路
《GitHub热门第一!Claude Code速成指南》介绍了一个开源教程项目,该项目通过可视化图表和可复制模板,帮助用户快速掌握Claude Code。教程包含10大模块,涵盖斜杠命令、Hook脚本等核心功能,提供渐进式学习路径和自测评估。项目采用MIT协议,支持多语言和离线阅读,15分钟即可上手使用。相比官方文档,该指南更注重功能组合和实战应用,适合不同水平的用户。目前项目保持与Claude Code同步更新,但仅聚焦于该工具本身。原创 2026-05-06 17:23:16 · 672 阅读 · 0 评论 -
太强了!输入提示词就能批量生成短视频,Short Video Factory这个开源神器让你效率翻10倍!
【短视频工厂:AI自动化短视频生成神器】这个开源项目通过AI技术实现短视频全流程自动化生产,用户只需输入提示词和素材,即可自动完成文案生成、语音合成、视频剪辑和字幕添加。支持跨平台运行(Windows/macOS/Linux),兼容主流AI接口,内置EdgeTTS语音和FFmpeg视频处理,能批量生成高质量短视频。特别适合自媒体运营、电商从业者快速制作营销内容,具有本地运行、数据安全、操作简单等优势,虽然字幕样式和语音选择还有提升空间,但已能显著提升短视频生产效率。原创 2026-05-06 16:45:33 · 474 阅读 · 0 评论 -
PPT 一键转视频!slides2video这个开源工具让豆包 TTS 自动配音,再也不用熬夜录旁白了
slides2video 是一款开源工具,可将 PPT 幻灯片一键转换为带 AI 旁白的视频。它使用豆包 TTS 语音合成 API,支持 100+ 音色,包括普通话、方言、英语及 IP 仿音。工具支持 HTML 幻灯片或 PNG 图片输入,通过四阶段流水线处理,独创 PCM 无缝拼接技术消除音频间隙。安装简单,5 分钟即可上手,支持断点续跑和自定义音色,是制作演示视频的高效解决方案。原创 2026-04-30 08:38:42 · 792 阅读 · 0 评论 -
pi-mono太强了!这个开源项目把 AI 编程 Agent 全家桶打包了——7 个工具从 LLM API 到终端 UI 一把梭
pi-mono是一个开源的一站式AI Agent工具包,由libGDX作者开发。它采用Monorepo架构,包含7个紧密协作的包:统一LLM API调用、Agent运行时管理、编码Agent CLI、终端UI库、Web组件、Slack机器人和GPU Pod管理。核心亮点包括支持20+LLM供应商的统一接口、可扩展的插件系统、会话分支管理、Token成本追踪等。通过简洁的CLI工具和TypeScript扩展,实现了高度灵活的AI编程助手功能,同时避免了过度复杂的架构设计。原创 2026-04-30 08:00:03 · 997 阅读 · 0 评论
分享