- 博客(851)
- 收藏
- 关注
原创 Kimi 玩了把大的,Agent 团战的时代要来了。
我上传了一段录屏,演示的是我操作知乎,去浏览器知乎上面帖子的一个过程,把这段录屏上传给 K2.5 Agent 进行复刻。当你开启这个模式,你会发现不再是一个 AI 在孤独地尝试回答你的问题,而是一个智能指挥官瞬间拆解任务,并。请仔细观看这段视频中的交互逻辑和动画效果:复刻这个社区网站的功能和 UI 细节,生成可运行的前端代码。看 Kimi 针对我抛出任务的处理方式,就能体会到 Agent 集群的优势和价值了。现在满大街都是 AI 生成的网页,逻辑没问题,但那配色和交互土气十足,没有格调儿。
2026-01-28 15:14:44
543
原创 GitHub 上狂揽 5 万 Star!26 年爆火的个人 AI 助手。
这个时候会在你浏览器打开一个控制台,你可以在控制台里面管理你的 Clawdbot。背后长期任务的上下文,可以不用每个对话都从头开始,而且记忆存储在本地电脑上,可持久化管理,隐私上对一些用户更可接受。推荐使用 MiniMax API Key,前往 MiniMax 的开放平台获取密钥,后面会用到。由于玩起来 Clawdbot ,得授权很高的系统权限,如果直接暴露在公网且没有防护,非常危险。,目前这一点外网讨论很多,很多人不敢把它部署在自己日常使用的电脑上,都是先跑在一个闲置设备上。
2026-01-27 15:04:55
392
原创 美团在 GitHub 上悄悄开源 AI 大模型?8 个大脑并行,绝了。
先来看看这个 8 个 Thinker 每个给出的要点:有的说不要擅自作主、自作聪明,有的说要用学习态度和执行意识保护自己,还有的说要把对抗性选择转化为建设性补充。可以看到,LongCat-Flash-Thinking-2601 会分析 8 个 Thinker 对同一个Query的回答,然后给出一个最终的、最佳的回复。组织一个商务局,有上级领导、上上级领导、上上上级领导、有客户、有内向的技术大牛,你是产品经理,老板让你排座位 & 主持一下,你要怎么排座位?明天就要汇报,我该怎么写这份报告?
2026-01-26 15:13:33
276
原创 4 个本周最火火火的 GitHub 开源项目。
它利用 HTML、CSS、SVG、Canvas 和 WebGL 等标准的 Web 技术来生成视频画面,并通过编程逻辑,比如循环、变量、API 数据获取来控制动画和内容的生成。在对话框中提出需求,比如显示上季度的销售数据时,Tambo 的 AI 引擎会解析意图,自动选择一个折线图组件,并填充正确的数据进行渲染,整个过程对用户是无感且自然的。你需要在 Tambo 中注册自己应用内的 React 组件,比如图表、表单、购物车啥的,并定义好每个组件所需的属性模式。不同于传统的视频剪辑软件,
2026-01-25 15:04:51
504
原创 发现了 GitHub 上 4 个文档工具开源项目,来瞧瞧。
这意味着你不需要联网,也不需要把文件发送给任何第三方服务器,所有的处理都在你的设备上完成。将 Markdown 格式的文本转换为漂亮的网页,通常会使用各种静态网站生成器,比如 Hexo、GitBook 啥的。你需要安装依赖,运行构建命令,将 Markdown 编译成 HTML 文件,最后再将这些静态文件部署到服务器上。这种轻量级的设计思路,使得 docsify 非常适合作为开源项目的文档说明,或者个人的技术笔记站点。多人同时在线编辑时,你能看到队友的光标在屏幕上飞舞,这种实时同步的体验非常流畅。
2026-01-24 15:04:38
577
原创 发现了 4 个好玩 SKills,已经在 GitHub 上开源了。
它基于维基百科关于 AI 写作特征的指南,把有 AI 味儿的生成文本改写得更加自然。通过模拟人类的写作习惯,让文章的语气更加真实、生动。智能体还具备自我更新的能力,可以根据用户的使用习惯不断优化剪辑规则。它结合了内容生成与视觉渲染技术,能够根据你设定的主题自动生成符合平台风格的文案。它能够辅助你完成视频处理工作,比如识别视频中的口误、静音片段以及语气词啥的。对于需要频繁制作口播类视频的创作者来说,这个工具提供了一套完整的工作流。通过简单的指令让 AI 自动处理这些多余的内容,提高剪辑效率。
2026-01-23 15:14:19
663
原创 清华开源!这个 GitHub 项目重新定义端侧 Agent 智能体 。
在多个榜单上超越了 8B 级 SOTA 模型,甚至在 Xbench-DeepResearch 上表现优于 OpenAI-o3 和 Claude-3.5-Sonnet。您可以查看其中的 dialog.json 文件,它记录了完整的任务执行轨迹,包括智能体的思考链、每次工具调用的请求与响应以及最终答案。的模型,在复杂的长程深度探索任务上,实现了超越同尺寸 SOTA、甚至比肩 30B 级和部分闭源大模型的性能。脚本会自动执行您定义的任务,展示智能体的完整交互过程,比如思考、工具调用、结果生成。
2026-01-22 15:25:57
523
原创 3700+ Star 的 MemOS:在 Claude 之前,就把 AI 的记忆和知识库分清楚了。
比如你说了啥,有加速推理的 Activation Memory,这是为了省 token 和加速,甚至还有 Parametric Memory 存 LoRA 权重的。,它不仅仅是一个存储工具,通过首创的三层记忆操作架构,为 AI Agent 装上了海马体,让 AI 真正拥有了可成长、可管理的记忆能力。如果你不使用 MemOS,去管理 AI 应用的记忆:你通常要自己切分文档、做向量化、写检索逻辑,还得担心上下文超长。传统 RAG 方案的核心痛点在于它是无状态的,而 MemOS 提供的是动态的长期记忆。
2026-01-20 15:05:05
382
原创 挖到了 GitHub 上 3 个 Claude Cowork 的开源平替。
它将 AI 的思考和执行过程变成了清晰的时间线和待办事项,你可以实时看到 AI 打算干什么,干到了哪一步。你可以创建不同的会话,针对不同的项目或任务设定独立的工作目录,并且随时保存或恢复之前的对话历史。直接在本地启动 OpenCode 服务,选择一个文件夹作为工作区,AI 就在你眼皮底下帮你干活。与普通的一问一答不同,当你给 Cowork 下达一个复杂指令的时候,它会先。,让智能体工作感觉像是在使用一个成熟的产品,而不是在操作冰冷的终端。,用它你能组建一支 AI 员工团队,自动协作完成复杂的任务。
2026-01-19 15:05:11
627
原创 挖到了 4 个有趣的 GitHub 开源项目,挺有意思的。
你不需要打开复杂的任务管理器,也不用盯着冷冰冰的数字百分比,只要瞥一眼右下角,看猫跑得快不快,就知道电脑现在的压力大不大。如果内置的角色你不喜欢,你可以上传自己的图片素材,制作独一无二的专属宠物。你可以选择在本地运行 Whisper 模型,完全离线使用,也可以配置 Groq 的 API 来获得更快的云端体验。很多语音输入法听不懂专业术语或特定的人名,Voquill 允许你建立自己的术语表,确保每次识别都是准确的。开发者考虑到了实际使用的干扰问题,所以你可以设置鼠标穿透,这样宠物就不会挡住你点击后面的按钮。
2026-01-16 15:43:30
516
原创 最近 火火火 的 4 个 GitHub 开源项目
集成了文档问答、知识可视化、练习题生成和深度研究等功能,能够基于你上传的教材或论文构建专属知识库,提供带引用的分步解答、个性化练习和真题模拟。无论是在解释晦涩的科学概念,还是梳理复杂的文献逻辑,甚至是在辅助撰写学术论文片段时,它都能给出更加严谨和专业的反馈。对于学生或者自学者来说,这种引导式的交互比单纯的问答更有教育意义,能让你真正掌握知识的内核。你只需要详细描述你的产品功能和目标用户,它就能从用户体验的角度给出专业的建议。像一位耐心的导师那样,通过一步步的引导和反问,启发你自己去思考问题的逻辑。
2026-01-15 15:11:40
466
原创 AI 智能体模拟平行世界 推演未来,这个 GitHub 项目有意思。
MiroFish 采用了增强版的时序 GraphRAG 技术来构建知识图谱,能处理具有先后顺序的复杂记忆,从而精准还原事件背景。使用的时候,你只需要上传种子材料,然后用自然语言描述你想预测的内容。除此之外,它还会生成一个可以深度交互的数字世界,你可以直接进去和里面的智能体对话,了解它们的想法。的开源项目,它尝试将大模型 Agent 从单体助手进化为社会群体,通过模拟社会演化来辅助现实预测。收集了尽可能多的信息后,用 MiroFish 来模拟一下,毕竟没有成本。这个项目的使用方式也很简单。
2026-01-14 15:04:54
683
原创 这 2 个 Skills 开源项目,最近在 GitHub 上火了。
对于 Cursor 用户,可以将 SKILL.md 的内容复制到项目的 .rules 文件或特定文件夹中,作为 AI 编码助手的背景知识库,帮助它更好地理解如何构建 Agent。BDI Mental States:基于 BDI(信念-愿望-意图)模型,将外部上下文转化为 Agent 的精神状态,实现更理性的推理。针对 Obsidian 的数据库/表格功能,教 AI 如何编写过滤器、公式、汇总和函数调用,避免 AI 瞎编不存在的函数。很多人用 Claude Code 直接操作本地的 Obsidian 仓库。
2026-01-13 15:42:22
837
原创 开源 3 天就 7000 Star!这个复刻 Manus 工作流的 GitHub 项目火了。
通过将信息拆分到 notes.md、plan.md 和 output.md,AI 在执行某一步时,只需要读取相关的片段,保持大脑清醒,Token 消耗也更少。例如,强制模型只能选择“回复用户”而不能调用“浏览器”,是通过在底层屏蔽 Token 实现的,而不是修改 Prompt。即使此时你关闭终端、重启电脑,AI 再次启动时读取文件,立刻就能知道进度条在哪里,实现了完美的可恢复性。强制 AI 先在一个 Notes 上写下它的调研结果、架构思路,确认无误后,再去修改正式的代码文件。
2026-01-12 15:58:41
894
原创 推荐 8 个本周 yyds 的 GitHub 开源项目。
如果你正在深度使用 Anthropic 的 Claude Code 工具,搭配这个自动化脚本可以极大地释放你的双手,让 AI 真正实现自主编程。Claude Code 的交互逻辑比较传统,它主要以流式对话的形式在命令行里输出内容,和你平时用 ChatGPT 差不多,只是搬到了终端里。它通过监测 Claude Code 的输出来判断当前的状态,一旦检测到任务完成或者出现无法解决的错误,它就会自动停止。下面这个截图是本周最火的 GitHub 开源项目,我已经对每个开源项目的描述进行了翻译,感兴趣的可以看看。
2026-01-11 15:34:35
982
原创 GitHub 上 2300 人 Star 的 Claude Code 可视化工作流编辑器。
你在画布上画完之后,点击导出,它会自动生成 Claude Code 能直接识别的 .claude/agents/ 和 .claude/commands/ 文件。除了部分你需要联网的 MCP 工具外,这个插件的所有编辑和生成逻辑都是在你的 VS Code 本地运行的,同时支持添加「询问用户」的节点,比如 AI 干完活了,弹个选项让你选通过还是打回。如果你是 Claude Code、Vs Code 的重度用户,可以研究研究。这时候你会看到一个新的标签页打开了,里面是一块空白的画布,这就是你的工作台。
2026-01-10 15:04:28
508
原创 发现了 4 个挺实用的 GitHub 开源项目,推荐给你。
大家平时用 ChatGPT 或者 Claude 都有个繁琐的步骤,看到不懂的代码报错或者想要翻译的一段外文,必须先选中复制,切换窗口到 AI 对话框,粘贴发送。不仅支持 OpenAI、Claude、Gemini 这些主流大厂的 API,国内的 DeepSeek、Kimi 也都在支持列表里。它主打轻量级和跨平台,我看了一下它的代码仓库,主要使用 C++ 编写,占比很高,它的运行效率和资源占用控制得相当不错。Everywhere 这个项目就是为了解决这个问题诞生的,它能看懂你屏幕上正在显示的内容。
2026-01-09 16:53:35
614
原创 GitHub 上 2300 点赞的搜索 Agent,有点惊艳啊。
OpenAI 研发的一个开源测试基准,专门用于评估 AI 模型,尤其是具备网页浏览功能的 Agent 在互联网上查找复杂、关联信息的能力。可以看到这个提示词输入下去,MiroThinker 一共进行了 30 多次搜索,10 多次浏览网页,最终才把它认为 OK 的结论呈现给你。搜索 Manus 核心成员的访谈记录,详细介绍一下每一个核心成员访谈时聊了啥,重点介绍一下 Manus 的立项、诞生历程,一定要详细。多轮修正:建立「推理-验证-修正」的闭环,一旦发现外部证据与假设冲突,立即调整路径,直到证据收敛。
2026-01-08 15:05:13
848
原创 推荐 5 个小众但有趣的 GitHub 开源项目。
它的底层其实是基于 ComfyUI 的,这意味着如果你觉得默认的画风不好看,或者配音太生硬,你可以直接替换掉底层的 ComfyUI 工作流。作者把交互做得挺细,针对竖屏视频和宽屏视频都有适配,甚至还考虑了批量生成来省 API 的钱,看得出是懂内容创作者痛点的。既然到了数据库里,那怎么玩就随你了,你可以用 SQL 查出你和对象谁发的消息更多,或者谁最喜欢在这个群里发表情包。以后不用在群里争论不休了,把所有人的位置输进去,让 AI 选个大家都必须接受的数学上的最优解,既省事又不伤和气。
2026-01-07 15:04:53
772
原创 盘点 5 个大厂最近开源的 GitHub 项目。
而且它通过 Core-Cocktail 训练法,在保留了强大的文本理解能力的同时,还能听懂你说话的语气,甚至在回复时带上相应的情感。它的交互方式非常灵活,不光支持文字指令,你甚至可以给它看一段视频,框选视频里的某个人或物体,它就能识别对应的声音并提取出来。比如生成一张森林里的女孩,它会把女孩放在一层,身后的树木一层,天空又是一层。的架构,简单说就是用粗粒度的特征来处理语义,用细粒度的特征来保证音质,这样既省算力又能跑得快。你不仅可以用它生成新的分层图像,甚至可以把现有的普通图片丢进去,让它帮你拆成图层。
2026-01-06 15:04:47
1010
原创 挖到 2 个 GitHub 开源项目,第 1 个堪称神器啊。
帮我写封邮件给 __PII_EMAIL_ADDRESS_00000001__,告诉他下周三的会议改到 __PII_LOCATION_00000002__。它知道哪里是标题,哪里是正文,哪里是图片下面的注释。然后,它利用大模型的翻译能力,把文字翻译好,再填回原来的位置。假设你有一个大模型 DeepSeek 的 Api Key ,你想翻译一个叫 paper.pdf 的文件。如果你想直接使用,可以访问如下链接,直接上传你的 PDF 文档,一键翻译。你看到的是完美的结果,而大模型那边拿到的是一堆乱码占位符。
2026-01-05 15:06:20
517
原创 让 AI 接管 Windows 和 MacOS,这个 GitHub 开源项目牛啊。
如果你有 OpenAI 兼容的接口,或者本地跑了个 Qwen3-VL,改改 main.py 里的 build_llm 函数就能用。这时候,你双手离开键盘,就会看到鼠标自己动了起来,像幽灵一样打开浏览器,输入文字,真有点赛博朋克的感觉。不,宏是死的,它是活的。把截图扔给多模态大模型,问它:“老铁,用户让我订机票,现在屏幕上这情况,我下一步该点哪?它也是给 AI 装上眼睛和手,让它像人一样看着屏幕,动鼠标、敲键盘,帮你把活儿干了。模型返回坐标,TuriX 控制你的鼠标移过去点击,或者在输入框里打字。
2026-01-04 15:04:35
803
原创 新挖掘了 3 个牛哄哄的 GitHub 教程库,有点意思啊。
课程设计得挺人性化,从最基础的怎么写 Prompt 才能让 AI 听懂人话,到后面怎么部署上线、怎么修 Bug,分了十几个模块一步步带着你走。比如怎么搞定你的前 10 个客户,怎么写那种投资人愿意看的商业计划书,甚至还有专门的计算器帮你算股权稀释,防止你一不小心把公司卖亏了。比如它会告诉你,怎么设计一个「反馈循环」让 AI 自己检查代码写得对不对,或者怎么搞定「人机协作」的流程,不让 AI 彻底放飞自我。,想做语音助手的、想搞数据分析的、或者想研究最新的 RAG 技术的,都能直接找到对应的文件夹。
2026-01-02 15:05:16
659
原创 2025 年 11 个神级 AI 开源平替,GitHub 杀疯了。
最近它在 AI 圈爆火,是因为它把 LangChain 等 AI 能力也做成了节点,让你能轻松把大模型嵌入到真实的业务流程里,真正让 AI 帮你处理复杂的办公琐事。它最吸引人的点在于,它是个完全开源的本地化 AI 搜索引擎,意味着你不用每个月掏 20 刀订阅费,就能在自己的电脑上拥有一个类似的 AI 搜索助理。相比于单纯的对话框,它更像是一个成熟的 AI 后端中台,能帮你把不稳定的模型变成稳定好用的服务,直接集成到你的产品或团队协作中去。这让它做海报、做 Logo 的能力直接起飞。我之前已经做过盘点,
2026-01-01 15:04:27
1273
原创 盘点 6 个本周 火火火火 的 GitHub 项目。
如果你感兴趣,直接在公众号后台进行问答对话就行了,比如输入:介绍一下 next-ai-draw-io 的开源项目,并给我这个开源项目的地址。一个给 AI 时代准备看板工具,不再是让你手动一个个去敲任务卡片,而是通过一种更直观、更具交互感的方式来组织你的开发流程。你只需要把你的经历、技能像填表一样写在配置文件里,它就能自动帮你生成各种排版精美的 PDF 和 Markdown。你可以直接把这些模板拷走,稍微改改就能跑通自己的自动化脚本,省去了大量反复调教 AI 的时间。
2025-12-31 15:05:07
565
原创 GitHub 上 10 个令人惊艳的 Agent 开发平台,太顶了。
它拥有图形化界面、Agent 市场、Tools、并发代理运行等功能,旨在解决 AutoGPT 在生产环境中使用难的问题,是一个功能比较完备的 Agent 管理平台。的循环:模型会评估当前状态,制定下一步计划,执行操作,并根据反馈结果进行自我修正,这使得它能够处理比单一对话更复杂、耗时更长的自动化工作流。可以定义多个可以相互对话的 Agent,可以是 LLM、人类或工具,它们通过对话来协作解决任务。的方式,让不同角色的智能体(CEO、CTO、程序员、测试员)在如设计、编码、测试、文档等环节进行深度协作。
2025-12-29 15:19:06
992
原创 GitHub 上 5000 人收藏的 Vibe Coding 神级指南。
这种感觉可能是对产品逻辑、用户流程、审美和交互的把握,剩下的体力活全交给 Cursor、Windsurf、Trae 等 AI 编程工具。它不仅包含了相关的哲学理论,还提供了一套成体系的工具链、提示词库和开发经验总结,旨在帮助开发者更高效地利用 AI 进行软件开发。让 AI 写代码前,必须有清晰的技术选型、实施规划和模块化设计,防止 AI 因为理解偏差导致项目逻辑混乱。教你如何用自然语言清晰地定义需求,如何让 AI 保持上下文一致,如何一分钟写出一个完整的 Web 应用,
2025-12-27 15:03:53
1107
原创 使用最新 MiniMax 2.1 复刻爆火人生 K 线图,真的给劲儿。
要求:黑色背景,绿色霓虹字体,打字机效果输出文字,背景要有动态的矩阵代码雨(Matrix Rain)落下,并且包含一个入侵系统的按钮,点击后屏幕出现故障 Glitch 效果。写一个展示球鞋的展示页面。在和 M2.1 对话进行 Vibe Coding 的时候, M2.1 能很好的遵循我的指令。而且一步步交付的结果是符合我的预期的,而且不会破坏原来稳定的部分。深入理解 Java 后端、Golang 服务及 C++ 客户端代码,并且站在对应岗位的研发工程师的角度上去思考,让 M2.1 写出的代码更贴近真实工程。
2025-12-25 15:04:53
1290
原创 推荐 5 个 yyds 的 AI 开源项目,给劲儿啊。
像素级模拟,60FPS。它旨在解决国内 AI 编程资源碎片化的问题,通过系统性的引导,让学习者能够快速掌握构建 AI 驱动应用的能力。通过支持 RDMA over Thunderbolt 等技术,exo 能够显著降低设备间的通信延迟,使得分布式推理的效率远高于普通的网络连接。这个开源教程的质量还是挺不错的,教程内容涵盖了从零基础到全栈实战的全过程,特别针对没有编程背景的初学者、大学生或希望提升效率的创业者。它打破了运行大模型必须依赖高端 GPU 的限制,通过资源池化的方式实现大模型的运行。
2025-12-24 15:04:30
875
原创 最近爆火的人生K线!GitHub 上有开源,真的太有趣了。
你输入八字,会给你整合一个提示词,提示词丢到 AI 里面,返给你 json 数据。把 json 数据 导入进去,就能可视化了。项目采用了 Vite 和 React 等现代前端框架,并提供了跨平台的桌面端支持,Windows 、macOS。利用 AI 大模型强大的推理能力,生成性格、事业、财富、婚姻、健康、六亲及发展风水等多维度报告。,看到整条K线时,你会发现当下的痛苦只是长周期里的一个小波动。把时间线拉长,你所经历的一切起伏,终将汇聚成向上攀升的曲线。如果你已经跌到了支撑位,那么接下来的每一步都是向上的。
2025-12-23 15:04:09
1337
原创 9 个 yyds 的 AI 控制电脑 GitHub 开源项目。
(AppAgent 和 OSWorld Agent),深入理解 Windows 应用程序的 UI 结构,跨多个应用程序执行复杂请求,比如从 PPT 中提取内容并发邮件。在屏幕截图上的UI元素打上数字标记 Label,让模型只需输出数字即可定位元素,类似于特斯拉自动驾驶的视觉标注逻辑。它想解决大模型在处理 UI 界面时的高延迟和计算成本问题,提供更快速、更精准的屏幕元素定位和操作。情景记忆,存储具体的步骤操作。它不直接看原始像素,而是通过一个中间层更精确地感知 GUI 元素,增强了模型对屏幕的理解能力。
2025-12-22 15:04:05
1348
原创 推荐 6 个近期火火火的 GitHub 项目
(如 Xbox、天气、新闻等),还能禁用遥测、移除 Bing 搜索集成、隐藏任务栏上的 Copilot 图标,甚至调整文件资源管理器的默认视图。它通过实时压缩历史记录,将庞大的对话历史转化为精简的 Observations,从而在理论上支持无限长的编程会话。Agent 可视化编排,就像下面视频演示的,像画流程图一样设计 AI 复杂的思考逻辑,比如如循环推理、反思。无论是图片、文档、电子书、音频还是视频,它都能处理。随着编程会话的深入,上下文窗口往往会耗尽,导致 AI 忘记之前的决策或代码变更。
2025-12-20 15:59:02
550
原创 一周狂揽 4500 的 Star!这个 AI 流程图开源项目火了。
你只需要描述你的需求,AI 就会利用 LLM 理解你的意图,并直接生成 Draw.io 可识别的 XML 代码。如果你平时工作中免不了要画流程图、架构图、UML 图啥的,但又觉得拖拽连线太费时间,这个项目绝对是你的。你让它画云架构图时,它会自动使用官方图标,而不是随便给你弄个方块写上名字,专业度直接拉满。,毕竟 AI 对空间布局的理解有时会飘,但它能瞬间帮你完成 80% 的工作量。它不再是你以前用的那个死板的绘图工具,而是一个听得懂人话的绘图助理。你在白板上随手画的草图,或者看到别人文档里的一张好图,
2025-12-18 15:04:27
554
原创 我把公众号文章导入了腾讯 ima,可以对话找开源项目了。
这个内测功能也挺有意思的,你可以在知识库里选中了 20 篇关于 AI 行业发展的文章,然后点击 生成报告,在对话框输入:基于这些资料,帮我生成一份 AI 发展报告。ima 把历史积累的所有开源项目文章都吃了进去,你想找什么,直接问它,它就能基于所有历史文章快速给你答案。这个是我一直很喜欢听的播客,在 ima 有两个知识库,整理了 AI 方向相关的材料和行业报告。
2025-12-17 15:04:27
803
原创 这个 GitHub 神器让 Gemini 写的网站 3 秒上线,累计部署 67 万个网站。
以前你拿到 AI 生成的代码,还得折腾 Vercel、买服务器、配 Nginx 或者是搞 GitHub Pages,挺烦的。几秒钟后,它会吐给你一个链接,通常是。这玩意儿不仅是快,而且很多时候是基于 IPFS 的,这意味着你的网站是钉在网络上的,很难被单点关停。PinMe 是一个一键部署工具,如果你想把 AI 生成的网站部署到线上,可以考虑用它。当你在本地运行命令时,PinMe 会自动检测你的静态文件目录,将其打包压缩。你可以把 AI 生成的代码下载下来,在你本地就是一个这样的文件。
2025-12-16 15:04:33
927
原创 推荐 4 个 yyds 的 AI 控制安卓手机的 GitHub 项目。
也是截取手机屏幕画面,把截图输入给视觉模型,模型结合用户的指令分析屏幕上的元素,决定下一步做什么。隐私数据,比如聊天记录、支付画面啥的不上传到云端也能自动化的你的安卓手机了。
2025-12-15 15:04:32
923
原创 搜罗了 4 个超炫酷的 AI 开源项目,速速收藏。
而且系统智能地分配任务,让擅长推理的 Claude 3.5 Sonnet 负责规划与架构,让速度更快的 Haiku 模型负责具体执行,从而在。支持长达 90 分钟的对话生成,而且,它能让 4 个不同的说话人在同一个音频里聊天,非常适合用来制作 AI 播客、广播剧或者长篇有声读物。此外,VibeSurf 坚持隐私优先,支持 Ollama 等本地大模型及自定义 LLM API,确保用户浏览数据的安全。使用这个开源项目, CC 不再是独自面对一个 AI 助手,而是可以根据需要,随时聘请不同的专家团队。
2025-12-14 15:04:58
1185
原创 推荐 10 个本周 yyds 的 GitHub 项目。
无论你是寻找一个不臃肿的任务管理工具来逃离配置地狱,还是想研究世界顶级 Rails 团队的最新代码实践,Fizzy 都是一个极具价值的开源项目。它不仅仅是一个简单的 RAG 工具,而是一个企业级的、模块化的全流程解决方案,解决复杂异构文档的知识提取与精确问答难题。、截图或现有的图表图片,AI 利用多模态视觉能力会识别图片中的元素与结构,并将其复刻为可编辑的 draw.io 图表。,它不仅能提取文本,还能通过 OCR 和版面分析技术理解表格、图片中的语义信息,从而构建统一的结构化知识中心。
2025-12-13 15:04:44
818
原创 挖到 4 个 Vibe Coding 的 GitHub 开源项目,速速收藏。
这个开源项目会强制你在写代码前先生成 PRD 和技术文档,这虽然是传统工程实践,但在 AI 时代通过 Prompt 自动化后变得非常高效。作者不仅提供了 Prompt,还通过详细的文档手把手教你如何配置环境、选择工具、以及如何用 Prompt 把控开发节奏。你通过对话的方式和 AI 协作,开发出一个应用或者网站。如果你想知道除了 Cursor 和 Windsurf 之外,还有哪些冷门但好用的 AI 编程工具,看这里就对了。看了一下,网页版工具还有挺多有意思的开源项目的,逛逛后面单独发一篇文章介绍一下。
2025-12-12 15:04:31
1125
原创 挖到 5 个很哇塞的 AI 开源项目,快来瞧瞧。
同时,它也能处理从 ChatGPT、DeepSeek 等网页复制的 HTML 富文本,确保 AI 回复的格式在办公软件中得到高保真还原。,覆盖股票交易、加密货币、投资组合管理及高频交易等多种金融任务,并提供标准的训练-测试-交易全流程流水线。你不仅能保留原始的笔迹风格,还能像操作电子笔记一样对纸质笔记的内容进行移动、擦除或修改。,说句话就能对生成的单页或局部区域进行精准调整,大幅降低了 PPT 的排版和修改门槛。,集成了 Stable Baselines 3、RLlib 等成熟的 DRL 算法库。
2025-12-11 15:20:37
734
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅