图像生成预处理工具箱 SDK
1. Canny 边缘检测
- Canny 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓,常用于生成线稿。
- 对应ControlNet模型: control_canny
![](https://img-blog.csdnimg.cn/img_convert/068bf38f85ccd60cf47ace186f6bafb2.png)
2. MLSD 线条检测
- MLSD 线条检测用于生成房间、直线条的建筑场景效果比较好。
- 对应ControlNet模型: control_mlsd
![](https://img-blog.csdnimg.cn/img_convert/b1fe6f6e6e82aaab9f0a53d5ca4eb516.png)
3. Scribble 涂鸦
- 不用自己画,图片自动生成类似涂鸦效果的草图线条。
- 对应ControlNet模型: control_mlsd
![](https://img-blog.csdnimg.cn/img_convert/827603572c0970419e07cf09d3ca0cc7.png)
4. SoftEdge 边缘检测
- SoftEdge 边缘检测可保留更多柔和的边缘细节,类似手绘效果。
- 对应ControlNet模型: control_softedge。
![](https://img-blog.csdnimg.cn/img_convert/e21cfa29c998879edef247baa0dd06d9.png)
5. OpenPose 姿态检测
- OpenPose 姿态检测可生成图像中角色动作姿态的骨架图(含脸部特征以及手部骨架检测),这个骨架图可用于控制生成角色的姿态动作。
- 对应ControlNet模型: control_openpose。
![](https://img-blog.csdnimg.cn/img_convert/3920dfb5eb3d72b831e819a68d80f920.png)
6. Segmentation 语义分割
- 语义分割可多通道应用,原理是用颜色把不同类型的对象分割开,让AI能正确识别对象类型和需求生成的区界。
- 对应ControlNet模型: control_seg。
![](https://img-blog.csdnimg.cn/img_convert/bfa3e4ae6ecb48b13bda30ec504b9d07.png)
7. Depth 深度检测
- 通过提取原始图片中的深度信息,生成具有原图同样深度结构的深度图,越白的越靠前,越黑的越靠后。
- 对应ControlNet模型: control_depth。
![](https://img-blog.csdnimg.cn/img_convert/bd9248228086fc4741a2b4438a43f052.png)
8. Normal Map 法线贴图
- 根据图片生成法线贴图,适合CG或游戏美术师。法线贴图能根据原始素材生成一张记录凹凸信息的法线贴图,便于AI给图片内容进行更好的光影处理,它比深度模型对于细节的保留更加的精确。法线贴图在游戏制作领域用的较多,常用于贴在低模上模拟高模的复杂光影效果。
- 对应ControlNet模型: control_normal。
![](https://img-blog.csdnimg.cn/img_convert/59c1e903e2c0c363025c50a6e90f6853.png)
9. Lineart 生成线稿
- Lineart 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓,用于生成线稿。
- 对应ControlNet模型: control_lineart。
![](https://img-blog.csdnimg.cn/img_convert/a3f901edf7ff29d98fe7103fb93e838b.png)
10. Lineart Anime 生成线稿
- Lineart Anime 边缘检测预处理器可很好识别出卡通图像内各对象的边缘轮廓,用于生成线稿。
- 对应ControlNet模型: control_lineart_anime。
![](https://img-blog.csdnimg.cn/img_convert/4afee3860451362d46135ceba8de82f9.png)
11. Content Shuffle
- Content Shuffle 图片内容变换位置,打乱次序,配合模型 control_v11e_sd15_shuffle 使用。
- 对应ControlNet模型: control_shuffle。
![](https://img-blog.csdnimg.cn/img_convert/a7ae830f2f4dfb3a7463e006e65aa61f.png)