GitHub开源AI项目精选
文章平均质量分 97
本系列专栏致力于挖掘和分享优秀的开源AI项目及其创新实践,旨在为技术爱好者和开发者提供有价值的资源与启发。
寻道AI小兵
10年+互联网架构师,聚焦AI大模型开发实战,分享前沿技术,解锁AI新技能,共探智能未来!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【GitHub开源AI精选】EvoCUA:美团开源的多模态计算机操作智能体,重塑自动化新范式
EvoCUA(Evolving Computer Use Agent)是由美团开源的多模态智能体,专注于计算机操作自动化任务。它通过自然语言指令和屏幕截图,实现对Chrome、Excel、PowerPoint等主流应用的端到端多轮操作,显著提升了AI在真实操作系统环境中的执行能力。在权威的OSWorld评测基准中,EvoCUA以56.7%的任务成功率位居所有开源模型榜首,超越多个业界知名竞品。原创 2026-02-08 08:00:00 · 585 阅读 · 0 评论 -
【GitHub开源AI精选】TuriX-CUA:开源AI桌面Agent,让AI像真人一样接管Windows和macOS
TuriX-CUA是一个基于Python开发的开源AI智能体项目,其核心目标是让大语言模型具备操作电脑的能力。它通过“看屏幕-理解-操作”的循环,实现自动化任务执行,支持Windows和MacOS系统,并且可以通过MCP协议与其他AI工具集成,极大地扩展了应用场景。原创 2026-02-07 08:00:00 · 1869 阅读 · 0 评论 -
【GitHub开源AI精选】AutoMV:开源多智能体音乐视频生成系统,开启AI创作新时代
AutoMV是一个无需训练的多智能体系统,能够直接从完整歌曲生成连贯的音乐视频。它通过音乐信息检索提取歌曲的关键特征,如节拍、结构和歌词时间戳,然后由编剧和导演智能体协作生成剧本和拍摄计划,最终通过生成模块和验证模块完成视频制作并确保质量。这一创新的系统不仅实现了从音频和歌词到完整音乐视频的端到端生成,还具备高效、低成本和高质量的特点。原创 2026-02-06 08:00:00 · 1654 阅读 · 0 评论 -
【GitHub开源AI精选】Live Avatar:阿里巴巴联合高校开源的实时音频驱动数字人生成系统
Live Avatar 是一个算法与系统协同设计的框架,能够实现实时、流式、无限长度的交互式数字人视频生成。它依托 140 亿参数的扩散模型,在 5 张 H800 GPU 上实现 20FPS 的实时流式生成,并支持长达 10000 秒以上的连续视频生成。这一技术不仅在生成速度上表现出色,还通过创新机制解决了长时生成中的稳定性问题,为数字人技术的广泛应用奠定了坚实基础。原创 2026-02-05 08:00:00 · 807 阅读 · 1 评论 -
【GitHub开源AI精选】Step-GUI:阶跃星辰推出的高效GUI自动化AI Agent
Step-GUI是一个专注于图形用户界面(GUI)操作的AI Agent系列模型,包含云侧模型Step-GUI和端侧模型Step-GUI Edge。它通过自进化训练流程和校准步进奖励系统(CSRS),将模型生成的交互轨迹转化为高质量训练数据,显著降低标注成本,同时提升模型性能。Step-GUI在多个基准测试中表现出色,如AndroidWorld和ScreenShot-Pro等,展现了其在GUI自动化任务中的强大能力。原创 2026-02-04 08:00:00 · 1827 阅读 · 0 评论 -
【GitHub开源AI精选】LightX2V:商汤开源的实时视频生成推理框架,推动视频创作新纪元
LightX2V 是由商汤开源的轻量级视频生成推理框架,旨在提供高效、高性能的视频合成解决方案。它支持多种视频生成任务,包括文本到视频(T2V)和图像到视频(I2V),并集成了多种先进的视频生成技术。通过模型优化、量化和缓存机制,LightX2V 实现了极高的推理速度和资源效率,能够在低资源环境下运行,例如仅需 8GB 显存即可运行 14B 模型。此外,它支持多种硬件平台(如 GPU 和 Hygon DCU)和前端接口(如 Gradio 和 ComfyUI),满足从新手到高级用户的多样化需求。原创 2026-02-03 08:00:00 · 825 阅读 · 0 评论 -
【GitHub开源AI精选】Wan-Move:阿里开源的高性能运动可控视频生成框架
Wan-Move是一个简单且可扩展的运动控制框架,能够在图像到视频生成过程中实现精细的运动控制。它通过潜在轨迹引导技术,无需对现有的图像到视频模型进行架构更改,即可实现高质量的运动控制。该项目的核心亮点包括高质量的5秒480p运动控制、新型潜在轨迹引导、细粒度的点级控制以及专用运动控制基准测试MoveBench。原创 2026-02-02 10:28:55 · 403 阅读 · 0 评论 -
Paper2Slides:一键将论文转为专业幻灯片的AI工具
Paper2Slides 是一个开源的 AI 工具,能够将学术论文、报告和文档转换为专业幻灯片或海报。它采用 RAG(检索增强生成)机制,直接从文档本身提取内容,确保生成的幻灯片内容准确且可追溯,避免信息漂移。该工具支持 PDF、Word、Excel、PowerPoint、Markdown 等多种文件格式,能精准捕获关键见解、图表和数据点。用户可以选择内置的专业主题,也可以用自然语言描述来生成自定义样式。具备即时预览模式,支持快速实验和实时调整,高级检查点系统可保存进度,随时暂停、恢复或切换主题。生成的幻灯原创 2026-02-02 10:23:11 · 480 阅读 · 0 评论 -
【GitHub开源AI精选】Open-AutoGLM:智谱AI开源的手机端智能助理框架,开启自动化操作新时代
Open-AutoGLM 是一个由智谱AI开源的手机端智能助理框架,基于AutoGLM构建。它能够通过自然语言指令,以多模态方式理解手机屏幕内容,并执行自动化操作来完成用户任务。该框架利用ADB控制设备,结合视觉语言模型感知屏幕,自动生成并执行操作流程。它支持多种操作,如点击、滑动、输入文本等,还内置敏感操作确认机制,确保用户隐私和数据安全。Open-AutoGLM 支持50多款主流中文应用,覆盖社交、电商、外卖等多个场景,旨在推动AI技术在移动端的发展和应用。原创 2026-01-08 08:00:00 · 1025 阅读 · 0 评论 -
【GitHub开源AI精选】ViMax:香港大学开源的多智能体视频生成框架,一键实现创意到视频的跨越
ViMax 是一个端到端的多智能体视频生成框架,整合了导演、编剧、制片人和视频生成器的功能。它支持 Idea2Video、Novel2Video、Script2Video 和 AutoCameo 等模式,能够生成分钟级长视频并保持人物与场景一致性。通过智能分镜、多摄像机模拟和自动化一致性检测等技术,ViMax 实现了从创意到成片的高效自动化流程。原创 2026-01-07 08:00:00 · 1344 阅读 · 0 评论 -
【GitHub开源AI精选】Supertonic:开源AI驱动的极速离线TTS引擎,重塑语音合成新体验
Supertonic是由Supertone公司开源的一款高性能、极速离线的文本转语音(TTS)系统,专为极致性能和隐私保护而设计。它采用轻量级神经网络架构,仅包含66M参数,生成语音的速度可达167倍实时速度,是目前最快的TTS系统之一。Supertonic完全离线运行,所有处理在本地设备完成,确保隐私和零延迟响应。它支持多种语言,可无缝处理复杂文本,无需预处理,并且高度可配置,适用于多种开发环境和应用场景。原创 2026-01-06 08:00:00 · 1022 阅读 · 0 评论 -
【GitHub开源AI精选】MemOS:解锁AI记忆潜能,打造记忆原生的智能系统
MemOS是一个开源的AI记忆管理操作系统,旨在为智能体和AI应用提供长期记忆能力。它通过统一的记忆抽象层,支持多种记忆类型(如文本记忆、激活记忆、参数记忆),具备动态知识图谱、记忆调度和生命周期管理等功能。MemOS能够使AI系统像人类一样记住用户过往信息,并在后续交互中主动调用记忆,从而实现更连贯、个性化的对话体验。原创 2026-01-04 08:00:00 · 1788 阅读 · 0 评论 -
【GitHub开源AI精选】Skywork R1V4-Lite:实时交互、深度推理,多模态智能体的全能王
Skywork R1V4-Lite是由昆仑万维推出的一款轻量级多模态智能体,它集成视觉操作、深度推理与任务规划三大能力,无需用户设计提示词,仅需一张图就能自动观察、推理并给出答案。该模型在多个权威视觉与感知基准评测上表现出色,展现出低延迟、高吞吐和极低成本的特点,适用于实时问答、视觉检索、智能助手等场景。原创 2026-01-03 09:19:06 · 684 阅读 · 0 评论 -
【GitHub开源AI精选】Lumine:字节跳动打造的3D开放世界通用AI智能体,开启跨游戏智能交互新时代
Lumine是由字节跳动Seed团队发布的通用AI智能体,它能够在3D开放世界游戏中实现实时感知、推理和行动。基于Qwen2-VL-7B-Base模型,Lumine通过类人交互范式,将感知、思考和行动整合在一起,展现出强大的任务执行能力、战斗能力、解谜能力、NPC交互能力以及GUI操作能力,并且具备跨游戏泛化能力。原创 2026-01-01 08:00:00 · 1541 阅读 · 0 评论 -
【GitHub开源AI精选】SmartResume:阿里巴巴开源高效智能简历解析系统
SmartResume是由阿里巴巴开源的智能简历解析系统,融合了OCR文本提取、PDF元数据解析、版面检测(YOLOv10模型)及轻量化大语言模型(Qwen3-0.6B微调版),支持PDF、图片、Word等多种常见格式的简历解析,能够将非结构化文本秒级转换为结构化数据,如姓名、工作经历、教育背景等,其核心创新在于通过版面感知技术重建阅读顺序,解决复杂布局导致的语义断裂问题,同时利用轻量化模型实现高效推理,平衡精度与成本。原创 2025-12-27 08:00:00 · 2225 阅读 · 0 评论 -
【GitHub开源AI精选】Kosong:月之暗面开源的AI代理开发利器,赋能智能体应用构建
Kosong是一个专为现代AI Agent应用设计的LLM抽象层,旨在解决与多个模型和工具交互时的技术栈可维护性问题。它通过统一消息结构、异步工具编排和可插拔的聊天提供商,帮助团队避免将业务逻辑硬编码到单一API,从而简化智能体的构建过程。原创 2025-12-26 08:00:00 · 1049 阅读 · 0 评论 -
【GitHub开源AI精选】DeepEyesV2:迈向多模态智能体的新里程碑
DeepEyesV2是一个由小红书团队开发的多模态智能体模型,旨在通过整合代码执行、网页搜索和图像操作等多种工具,实现对复杂问题的主动解决。该模型通过两阶段训练法,即冷启动阶段和强化学习阶段,使模型能够动态选择、组合和使用工具,从而在真实世界理解、数学推理和搜索密集型任务中表现出色。原创 2025-12-25 08:00:00 · 1645 阅读 · 0 评论 -
【GitHub开源AI精选】Meta Omnilingual ASR:支持1600+语言的开源多语言语音识别技术
Omnilingual ASR是由Meta AI 团队开发的一种创新的自动语音识别系统。它通过一个通用的转录模型,能够将超过1600种语言的口语转换为书面文本。该系统基于强大的自监督学习架构和大规模多语言数据集构建,能够在仅有少量标注数据的情况下实现对多种语言的高效识别。原创 2025-12-24 08:00:00 · 799 阅读 · 0 评论 -
【GitHub开源AI精选】DiaMoE-TTS:清华和巨人网络开源的多方言语音合成利器
DiaMoE-TTS 是一个基于国际音标(IPA)的统一框架,专门针对多方言语音合成的复杂性而设计。它在 F5-TTS 架构的基础上,引入了方言感知的混合专家(MoE)模型来模拟不同方言之间的语音差异,并利用低秩适配器(LoRA)和条件适配器进行参数高效的自适应,从而能够快速迁移到新的方言。与依赖大规模或专有资源的方法不同,DiaMoE-TTS 支持可扩展的开放数据驱动合成,实验表明其能够生成自然且富有表现力的语音,即使在只有数小时数据的情况下,也能对未见过的新方言以及专业领域(如京剧)实现零样本性能。原创 2025-12-08 08:00:00 · 1370 阅读 · 0 评论 -
【GitHub开源AI精选】Glyph:智谱与清华开源的视觉文本压缩框架,突破大模型上下文限制
Glyph 是一个通过视觉 - 文本压缩扩展上下文窗口的框架,它将长文本渲染为图像,利用视觉语言模型(VLM)处理图像,从而在不增加模型实际上下文长度的前提下实现上下文的高效扩展。这种方法不仅大幅降低了计算成本和显存占用,还显著提升了推理速度,同时在多模态任务中展现出强大的泛化能力。原创 2025-12-04 08:00:00 · 828 阅读 · 0 评论 -
【GitHub开源AI精选】LLaVA-OneVision-1.5:面向多模态训练大众化的全开源框架
LLaVA-OneVision-1.5 是由 EvolvingLMMS-Lab 开发的全开源多模态框架,旨在通过高效训练和高质量数据实现多模态任务的高性能和低成本。该模型采用自研的 RICE-ViT 作为视觉编码器,结合 2D 旋转位置编码和区域感知注意力机制,支持可变输入分辨率。基于 Qwen3 的语言模型,通过三阶段训练流程(语言–图像对齐、高质量知识中期预训练和视觉指令对齐)进行优化。它在多模态基准测试中表现出色,成本可控,且全链条透明开放。原创 2025-12-03 08:00:00 · 1078 阅读 · 0 评论 -
【GitHub开源AI精选】MineContext:字节开源的主动式上下文感知 AI 工具,助力高效信息管理
MineContext 是一个主动式上下文感知 AI 工具,它通过每 5 秒截取一次屏幕,经过处理后,批量发送给视觉语言模型(VLM)分析,提取出人物、产品、公司档案等六种结构化上下文,主动生成日报、待办、洞察等高质量信息,而非被动等待用户提问。它采用存储本地、分析云端的混合架构,包含元模型、采集器、存储层、更新引擎和接口层五个核心组件,以隐私优先,所有数据存储在本地,确保用户信息安全。原创 2025-12-02 08:00:00 · 1724 阅读 · 0 评论 -
【GitHub开源AI精选】StableAvatar:复旦大学联合微软亚洲研究院推出的无限时长音频驱动虚拟形象视频生成技术框架
StableAvatar 是一个基于扩散变换器(Diffusion Transformer)的音频驱动视频生成技术框架。它能够根据一张人物图片和一段音频生成与音频高度同步的人物口型和表情的视频,且视频长度理论上可以无限延长。该技术框架通过其独特的架构和创新机制,解决了以往技术在生成长视频时的关键问题,显著提升了生成视频的自然度和连贯性。原创 2025-12-01 08:00:00 · 1788 阅读 · 0 评论 -
【GitHub开源AI精选】OpenLens AI:清华推出的医学研究全自主AI助手,开启科研新纪元
OpenLens AI是一个专为医学研究设计的高度自主人工智能研究助手,由清华大学自动化系开发。它通过多智能体协作,能够从文献综述、实验设计、数据分析到论文生成的全流程自动化,将科研周期从“月级”缩短至“小时级”,极大地提升了医学研究效率。该系统不仅支持处理健康信息学领域复杂的、多模态的数据,还提供了用户友好的网页版交互界面,用户只需上传数据集和简单的研究想法,即可启动研究项目。原创 2025-11-10 08:00:00 · 1302 阅读 · 0 评论 -
【GitHub开源AI精选】FireRedChat:小红书开源的全双工语音交互系统,开启智能语音新时代
FireRedChat是由小红书智创音频团队开发的一款全双工语音交互系统,它提供了一个可完全自主部署的解决方案,用于构建实时语音AI代理。该系统不仅支持用户和AI代理同时说话,实现无缝的实时双向对话,还具备可控打断机制,显著提升了人机语音交互的自然度和流畅性。FireRedChat的出现,为智能语音助手的发展开辟了新的道路,其开源的特性也吸引了众多开发者的关注。原创 2025-11-09 08:00:00 · 2317 阅读 · 1 评论 -
【GitHub开源AI精选】SciToolAgent:浙大开源的知识图谱驱动的科研利器
SciToolAgent是一个强大的工具框架,它将大型语言模型(LLMs)与科学工具知识图谱(SciToolKG)相结合,能够自动规划、执行并总结解决复杂科学任务的工作流程。该平台整合了超过500种科学工具,覆盖生物学、化学、材料科学等多个领域,可处理数据处理、分子建模、文献分析等关键科研任务。通过构建全面的科学工具知识图谱,SciToolAgent能够智能地为科研任务推荐最佳工具组合,实现从任务解析到结果生成的全链路自动化执行。原创 2025-11-08 08:00:00 · 1435 阅读 · 0 评论 -
【GitHub开源AI精选】Presentation-AI:ALLWEONE团队打造的开源AI演示文稿生成工具
Presentation-AI是由ALLWEONE团队推出的一款开源AI演示文稿生成工具。它能够根据用户输入的主题,自动生成完整的PPT大纲和精美的幻灯片,支持多种语言、主题风格以及自定义配色方案。其自动智能配图功能可根据内容生成合适的插图,用户在生成前可预览大纲并调整,生成后还能实时编辑幻灯片。Presentation-AI支持专业和轻松两种演示风格,适用于工作汇报、创业路演、教学等多种场景。原创 2025-11-07 08:00:00 · 946 阅读 · 0 评论 -
【GitHub开源AI精选】通义DeepResearch:开源深度研究智能体,助力复杂信息检索与多步推理
通义DeepResearch是一个开源的深度研究智能体,拥有300亿参数,每次激活30亿参数。它专为长周期、深度信息检索任务设计,支持ReAct模式和深度模式(Heavy Mode),后者通过迭代研究范式(IterResearch)提升复杂推理能力。该项目采用全流程合成数据方案,无需人工干预即可生成高质量数据集,突破智能体能力上限。训练流程涵盖智能体持续预训练(Agentic CPT)、监督微调(SFT)和强化学习(RL),形成完整的端到端训练链路。原创 2025-11-06 08:00:00 · 1192 阅读 · 0 评论 -
【GitHub开源AI精选】Strix:AI驱动的安全测试先锋,助力应用安全防护
Strix是一个开源的AI驱动安全测试工具,旨在帮助开发人员和安全团队快速发现并验证应用程序中的漏洞。它通过模拟真实黑客攻击,动态运行代码,有效减少误报,支持本地代码库、GitHub仓库和Web应用的安全评估,具备自主安全工具、全面漏洞检测和分布式代理网络等强大功能。原创 2025-11-05 08:00:00 · 1762 阅读 · 0 评论 -
【GitHub开源AI精选】DeepDoc:开源本地知识库深度研究工具,多格式文档解析与智能报告生成
DeepDoc是一款开源的深度研究工具,专注于对本地知识库进行高效、深入的信息挖掘,它通过智能化的研究式工作流自动提取PDF、DOCX、JPG、TXT等多种格式文件中的文本内容,并将其切分后存入向量数据库支持语义相似性检索,最终生成结构清晰的Markdown格式研究报告。原创 2025-11-04 08:00:00 · 1663 阅读 · 0 评论 -
【GitHub开源AI精选】AI-Video-Transcriber:开源AI视频转录与摘要工具,支持30+平台,赋能高效内容处理
AI-Video-Transcriber是一个开源、跨平台且支持多语言的AI视频转录和摘要工具,能够从YouTube、Bilibili、TikTok等30多个主流视频平台抓取内容,并利用先进的AI技术自动完成语音转文字、文本校对优化、内容摘要生成乃至全文翻译等一系列任务。原创 2025-11-03 08:00:00 · 1280 阅读 · 1 评论 -
【GitHub开源AI精选】Parlant:为企业级应用而生的开源LLM智能体框架,打造【AI员工监工】,让LLM可解释、可审计
Parlant是一个开源的LLM代理行为建模引擎,旨在帮助开发者快速创建符合业务要求的对话式代理。它通过自然语言规则定义来确保AI代理的行为符合业务逻辑,解决了传统AI代理在实际使用中忽略系统提示、产生幻觉式回答、无法一致处理边缘情况等问题。Parlant支持多种LLM提供商,如OpenAI和Anthropic,并提供了丰富的企业级功能,如对话分析、迭代改进和内置防护栏等。原创 2025-11-02 08:00:00 · 1996 阅读 · 0 评论 -
【GitHub开源AI精选】Super Agent Party:开源3D AI桌面伴侣,开启智能交互新体验(聊天、写代码、控直播)
Super Agent Party是一个开源的3D AI桌面伴侣软件,将桌宠、智能助手、知识库、机器人控制等多种功能集于一体。它基于开源架构构建,利用大型模型(LLM)进行智能处理,并通过集成多种工具链实现功能扩展。用户能通过Docker或源码快速部署到Windows、macOS、Linux等系统,支持接入微信、QQ、B站直播等平台,具备联网能力、永久记忆、代码执行和多模态交互等功能。它既能作为可爱的桌面宠物陪伴用户,又能作为智能助手、知识秘书、游戏搭档、直播互动伙伴,是家庭物联网中枢,极大地提升了生活和工原创 2025-11-01 08:00:00 · 1957 阅读 · 0 评论 -
【GitHub开源AI精选】AgentScope:阿里开源多智能体核弹、并行工具+Actor架构+秒级介入+沙箱隔离
AgentScope 1.0 是一个基于 ReAct 范式的多智能体开发框架,旨在为开发者提供一个灵活且强大的平台,用于构建和部署基于大语言模型的智能体应用。它通过三层技术架构,包括 AgentScope 核心框架、AgentScope Runtime 和 AgentScope Studio,实现了从开发到部署的全生命周期支持。AgentScope 的关键特性包括实时介入控制、智能上下文管理和高效工具调用,这些特性使得智能体应用的开发更加简单、运行更加安全、监控更加透明。原创 2025-10-31 08:00:00 · 1590 阅读 · 0 评论 -
【GitHub开源AI精选】Open-Fiesta:开源AI聊天平台,多模型并行对比的新选择
Open-Fiesta 是一个开源的多模型 AI 聊天平台,采用 Next.js 14 构建。该平台兼容多种 AI 服务提供商(如 Gemini、OpenRouter 等),支持接入多个 AI 模型,用户可同时选择最多 5 个模型进行并行对比。它集成了网页搜索功能,并支持图片上传(目前仅 Gemini 模型可用),搭配简洁直观的界面设计,带来流畅的交互体验。通过配置环境变量(如 API 密钥),用户可快速完成部署并投入使用。原创 2025-10-30 08:00:00 · 1004 阅读 · 0 评论 -
【GitHub开源AI精选】WhisperLiveKi:开源实时语音识别利器,实时转写+说话人识别+完全本地部署,一键搞定会议纪要
WhisperLiveKit 是一个开源的实时语音识别工具,能够将语音实时转录为文字,并且支持说话人识别功能。它基于先进的技术,如 SimulStreaming 和 WhisperStreaming,提供了超低延迟的转录功能。更重要的是,WhisperLiveKit 完全在本地处理语音数据,确保了隐私和安全。它支持多种语言,可以通过简单的命令快速启动,并且提供了 Web 界面和 Python API,方便开发者和普通用户使用。原创 2025-10-29 08:00:00 · 1436 阅读 · 0 评论 -
【GitHub开源AI精选】MobileUse:由MadeAgents打造的分层反思驱动的移动自动化GUI代理
MobileUse是由MadeAgents团队开发的一款分层反思驱动的GUI代理,专为移动设备上的自动化任务执行而设计。它通过多模态大语言模型(MLLMs)实现了对移动设备的自动操作,能够基于用户输入描述自动完成任务。MobileUse的核心优势在于其分层反思架构,能够在不同时间尺度上自我监控、检测和从错误中恢复,同时通过主动探索模块解决不熟悉环境中的冷启动问题。这一创新框架在AndroidWorld和AndroidLab基准测试中均取得了最先进的性能表现,并且已经发布了可用于物理移动设备自动化的工具包,方原创 2025-10-28 08:00:00 · 1753 阅读 · 0 评论 -
【GitHub开源AI精选】Chaterm:开源的AI终端工具,运维版Cursor,助力高效云管理
Chaterm 是一款开源的智能、安全的 AI 终端工具,由一群 DevOps 专家开发,专为云从业者和开发运维人员设计。它基于 AI Agent,让用户能够用自然语言代替复杂的命令行操作,提供基于个人知识库的智能补全功能,支持高精度语音命令输入,具备跨平台的个性化语法高亮、类似 Sublime Text 的可视化 Vim 编辑体验以及全局别名设置。Chaterm 基于零信任安全模型,支持 IAM 和工作区隔离,配备隐私水印、屏幕录制和数据传输控制等安全功能,助力用户高效、安全地管理云资源和设备。原创 2025-10-27 08:00:00 · 854 阅读 · 0 评论 -
【GitHub开源AI精选】Coze Studio:字节跳动开源的AI智能体开发平台,一站式构建与部署AI应用
Coze Studio是由字节跳动开源的AI智能体开发平台,旨在为开发者提供一个从开发到部署的全流程支持环境。它集成了Prompt、RAG、Plugin、Workflow等核心技术,通过可视化工作流编排,支持零代码或低代码开发复杂AI应用。平台内置插件框架,可将第三方API或私有能力封装为插件,扩展智能体功能。Coze Studio采用Golang和React开发,遵循领域驱动设计(DDD)原则,易于二次开发,支持本地及私有化部署,部署门槛低,仅需双核CPU和4GB内存即可运行,提供一键部署脚本。原创 2025-10-26 08:00:00 · 1870 阅读 · 0 评论 -
【GitHub开源AI精选】Hugging Face AI Sheets:开源无代码构建、丰富和转换数据集的利器
Hugging Face AI Sheets 是一个开源的无代码工具,旨在帮助用户通过 AI 模型快速构建、丰富和转换数据集。它支持本地部署和在 Hugging Face Hub 上部署,并能够调用数千种开源模型,包括来自 OpenAI 的 `gpt-oss` 模型。AI Sheets 提供了类似电子表格的界面,用户可以通过自然语言描述或导入现有数据集,快速生成和优化数据。它不仅支持文本生成,还支持图像生成,能够满足多种复杂的数据处理需求。原创 2025-10-25 08:00:00 · 1004 阅读 · 0 评论
分享