ComfyUI Mixlab Nodes 项目推荐
1. 项目基础介绍和主要编程语言
ComfyUI Mixlab Nodes 是一个开源项目,旨在扩展 ComfyUI 的功能,使其能够支持更多高级特性,如将工作流转换为 Web 应用、屏幕共享、浮动视频、GPT 集成、3D 处理、语音识别和文本转语音等。该项目主要使用 Python 语言进行开发,同时也涉及到一些前端技术如 JavaScript 和 HTML。
2. 项目的核心功能
- Workflow-to-APP: 支持将工作流转换为 Web 应用,并支持多个 Web 应用的切换。
- ScreenShare & FloatingVideo: 支持从任何软件捕获屏幕像素流,并用于 LCM-Lora 集成。
- GPT & 3D: 集成 GPT 和 3D 处理功能,支持本地和云端的 LLM。
- SpeechRecognition & TTS: 支持语音识别和文本转语音功能,实现实时语音交互。
3. 项目最近更新的功能
- 新增 Her 的 DEMO 页面: 支持与数字人对话,右键菜单支持 text-to-text,方便对 prompt 词补全,支持云 LLM 或本地 LLM。
- 增加 MiniCPM-V 2.6 int4: 这是 MiniCPM-V 2.6 的 int4 量化版本,运行时会使用更低的 GPU 内存(约 7GB)。
- 移动端适配: 修改了 app 模式的 Mask 编辑器,增加了 p5.js 作为输入节点。
- App 模式增加 batch prompt: 支持批量提示词,可以将动态提示词批量组成后运行。
- 增加 API Key Input 节点: 用于管理 LLM 的 Key,同时优化 LLM 相关节点,为后续 agent 模式做准备。
- 增加 SiliconflowLLM: 可以使用由 Siliconflow 提供的免费 LLM 相关插件。
- 新增 AppInfo 节点: 可以通过简单的配置,将工作流转变为一个 Web APP。
- 支持动态提示: 支持将输出显示到 ComfyUI 背景(TouchDesigner 风格)。
- 增加 Edit Mask: 方便在生成的时候手动绘制 mask。
- 增加 Real-time Design ScreenShareNode & FloatingVideoNode: 支持实时设计屏幕共享和浮动视频节点。
通过这些更新,ComfyUI Mixlab Nodes 进一步增强了其功能和灵活性,为用户提供了更多高级特性和更好的用户体验。