前言
全球首个2D真人级AIGC实时渲染数字人模型开源了!
这是数字人技术界的一次大爆炸,我们即将迈入一个全新的交互时代,一个由数字人代理引领的时代。
DUIX(Dialogue User Interface
System),这个由硅基智能打造的AI数字人智能交互平台,不仅仅是一个技术革新,它更是一个开放的生态,让每个开发者都能在这个平台上大展拳脚。
开源的数字人交互能力,让开发者可以轻松接入各种大模型、语音识别(ASR)、语音合成(TTS)等能力,实现数字人的实时交互。
DUIX的核心功能
首先,它的部署成本极低,技术支持团队已经打好了基础,让多种部署变得轻而易举。
其次,它的网络依赖极小,无论是在网络环境复杂的地铁,还是需要高度保密的银行,DUIX都能游刃有余。
最后,它的功能极为多样化,无论是视频、媒体、客服、金融还是广电,DUIX都能满足你的需求。
完全开源
硅基数字人SDK是完全开源的,从底层推理引擎到上层的商业化应用逻辑,所有的源代码都开放了。
开发者可以深入了解其工作原理,并进行进一步的优化和创新。这不仅仅是一个技术的开源,更是一个创新的开源,一个生态的开源。
这个开源的SDK提供了14个数字人模板,你可以前往开源项目的地址下载和使用这些数字人模型。
而且,硅基数字人还会不定期更新本地模型包,让你能够下载和使用最新的模型。
这些数字人模型不仅部署成本低,画面流畅,而且真实度高,能够精准模拟动作、说话的唇形、微表情。
如何部署使用?DUIX提供了详细的使用部署教程,无论是安卓还是iOS,都有详细的集成教程。SDK还提供了多种回调方法,包括数字人渲染报错回调、音频播放结束回调、音频播放进度回调等。动作相关的还支持随机动作、开始动作、结束动作等。以下是安卓端的部署方法,感兴趣的朋友,可以试试:
真人级数字人的应用场景极其广泛。无论是AI伴侣、直播带货、数字人短视频生成,还是批量数字人口播视频内容生成,DUIX都能轻松应对。它可以用于抖音、视频号等平台的营销推广,也可以用于品牌IP、内容制作。
最后,让我们看看是谁开源了这个项目。答案是硅基智能,一个AI公司,他们已经成功克隆了50万数字人,实现了AIGC产品在十多个行业的商业化应用。为了降低技术门槛,为个人开发者和企业提供参与数字人的创新的机会,硅基智能公开了数字人技术的核心代码。
开源项目地址:
https://github.com/GuijiAI/duix.ai
这是一个技术的开源,更是一个创新的开源,一个生态的开源。硅基智能的这一举动,无疑为推动数字人技术的快速发展和普及出了一份力。让我们一起期待,数字人技术将如何改变我们的世界。
提示词
Stable Diffusion 最强提示词手册
- Stable Diffusion介绍
- OpenArt介绍
- 提示词(Prompt) 工程介绍
- …
第一章、提示词格式
- 提问引导
- 示例
- 单词的顺序
- …
第二章、修饰词(Modifiers)
- Photography/摄影
- Art Mediums/艺术媒介
- Artists/艺术家
- Illustration/插图
- Emotions/情感
- Aesthetics/美学
- …
第三章、 Magic words(咒语)
- Highly detailed/高细节
- Professional/专业
- Vivid Colors/鲜艳的颜色
- Bokeh/背景虚化
- Sketch vs Painting/素描 vs 绘画
- …
第四章、Stable Diffusion参数
- Resolution/分辨率
- CFC/提词相关性
- Step count/步数
- Seed/种子
- Sampler/采样
- 反向提示词(Prompt)
第5章 img2img(图生图),in/outpainting(扩展/重绘)
- 将草图转化为专业艺术作品
- 风格转换
- lmg2lmg 变体
- Img2lmg+多个AI问题
- lmg2lmg 低强度变体
- 重绘
- 扩展/裁剪
- …
第6章 重要提示
- 词语的顺序和词语本身一样重要
- 不要忘记常规工具
- 反向提示词(Prompt)
- …
第7章 OpenArt展示
- 提示词 (Prompt)
- 案例展示
- …
篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的卡片进行领取!