自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 IC Light使用条件信息来控制生成过程中的光照和色彩特征

加载成功后,它将尝试将 IC-Light Unet 的权重应用到克隆的模型中,并进行必要的调整。encode(positive, negative, vae, foreground, multiplier, opt_background=None): 此方法接收正向和负向的条件,以及可选的背景潜在表示,并通过计算合成潜在表示来生成条件编码。潜在表示合并:前景和可选背景的潜在表示将根据需要重复并合并,以适应不同的批处理大小。样本尺寸调整:前景和背景样本的尺寸将被调整以保持一致性。

2024-06-23 15:21:58 489

原创 高斯模糊类 `GaussianBlur`

pass这里定义了类,用于应用高斯模糊效果到图像上。NODE_NAME用于标识这个节点的名称,这个名称在日志和其他用户界面元素中用于引用此功能。return {},定义了这个类需要的输入类型。其中image表示需要处理的图像,blur表示应用的模糊强度,此参数有默认值和范围限制。定义了类的返回类型和函数名称。FUNCTION指定主要的功能函数为。

2024-06-22 14:17:01 260

原创 色彩校正阴影和高光类 `ColorCorrectShadowAndHighlight`

pass定义了一个名为的类,用于处理图像的阴影和高光色彩校正。NODE_NAME用于标识节点名称。return {},定义了类的输入类型,包括必需的和可选的参数。这些参数控制了阴影和高光的色彩调整参数,如亮度、饱和度、色调等。定义了类的返回类型和函数名称。FUNCTION指定主要的功能函数为,并将此节点归类到。

2024-06-22 14:13:11 265

原创 Zoe Depth Anything 预处理器类

构造函数接收一个模型对象,并默认将设备设置为 “cpu”。定义了预处理器需要的输入类型,包括环境参数。

2024-06-22 14:07:00 393

原创 图像调整大小 ImageResize

return {此类定义了如何接受输入并执行图像大小调整。它包括多种调整大小的方法、插值方式、以及何时执行大小调整的条件。

2024-06-22 11:02:23 351

原创 IC-Light 在神经网络框架中的集成

定义了一个常量NODE_NAME,用于在日志消息中引用当前的图像处理节点,这里指的是 LaMa (代表一种图像修复或增强技术)。return {},image: 待处理的图像。mask: 应用于图像的掩膜。lama_model: 用于图像处理的模型,支持多种选择。device: 执行图像处理的计算设备。: 是否反转掩膜。mask_grow: 掩膜扩展的像素数。mask_blur: 掩膜模糊的程度。

2024-06-22 10:24:45 332

原创 ImageBlend 类实现解析

此行代码从当前目录的imagefunc模块中导入所有内容。假设imagefunc包含图像处理相关的函数和定义,例如混合模式、掩码转换工具等。这些工具将在ImageBlend类中使用。定义了一个常量NODE_NAME,用于在日志消息中引用当前的图像混合节点。return {},必需输入: 背景图像。: 需要叠加的图层图像。: 布尔值,用于指定是否应该反转图层掩膜。blend_mode: 从imagefunc导入的chop_mode,一种图像混合模式。opacity。

2024-06-22 10:20:22 782

原创 ImageBlend 类的实现

这部分代码将 `ImageBlend` 类注册到一个更大的图像处理或节点系统中,允许通过指定的名称调用 `ImageBlend` 功能。- `blend_mode`: 从 `imagefunc` 导入的 `chop_mode`,一种图像混合模式。- **图像混合**:对每个图像批次执行混合操作,使用指定的混合模式和透明度将图层图像合成到背景图像上。- **预处理图像**:将每个图像张量转换为PIL图像,并为RGBA模式的图像提取透明通道作为掩膜。- **日志记录**:记录处理过程的细节,如处理的图像数量。

2024-06-22 10:19:07 275

原创 项目实训第六周(修改输出文字格式为XML)

由于缺乏统一的结构,信息的解析和处理变得困难,增加了开发和维护的复杂性。为了确保设计的合理性和可扩展性,我参考了多种XML应用的最佳实践,并结合项目的具体需求,设计了一种既包含必要信息又具备灵活性的XML结构。为了验证XML格式的有效性,我编写了一些测试用例,对生成的XML文件进行了详细的检查和验证。在接下来的工作中,我将继续努力,不断完善和优化我们的系统,为最终的项目交付提供更高质量的技术支持。这个调整的主要目的是提高系统的灵活性和可维护性,同时使后续的处理更加规范和标准化,便于与其他系统和模块的集成。

2024-05-29 23:49:08 117

原创 项目实训第五周(调研并部署新的和谐化方法)

通过对PIH模型的学习和部署,我不仅深入理解了其工作原理和实现细节,还为我们的项目提供了一个更稳定和高质量的图像和谐化解决方案。尽管还有许多地方需要改进,但我对后续的开发工作充满信心,相信在接下来的时间里,我能够不断完善和优化我们的图像和谐化技术,为最终的海报生成提供更高质量的技术支持。接下来,我对现有的pipeline进行了必要的调整,使其能够接受和处理PIH模型的输入和输出。PIH是一种逐步图像和谐化技术,通过多阶段的处理方式,逐步调整图像的前景和背景,使它们在颜色和光照上更加一致。

2024-05-29 23:45:25 206

原创 项目实训第四周(尝试和其他同学组合连接pipeline)

为了实现这一点,我使用了Python的PIL库(Pillow),该库提供了丰富的图像处理功能,能够方便地进行图像的读取、处理和保存。这是一个非常关键的步骤,因为我们需要确保不同模块之间的无缝衔接,以实现最终的图像拼合和生成高质量的海报。为了确保文字的效果符合预期,我对文字的颜色和背景进行了多次调整和优化。在接下来的工作中,我将继续努力,探索更多可能的解决方案,并进一步优化我们的图像和谐化技术。我相信,通过不断的学习和实践,我能够找到一种更有效的方法,解决目前的问题,为最终的海报生成提供更高质量的技术支持。

2024-05-29 23:41:43 293

原创 项目实训第三周(实现图像拼合)

接下来,我编写了代码来实现图像和文字的拼合效果。通过与负责LLM的同学的密切合作,我成功地实现了图像和文字的拼合效果,为后续的项目开发奠定了坚实的基础。在接下来的工作中,我将继续努力,不断完善和优化我们的图像和文字拼合技术,为最终的海报生成提供更高质量的技术支持。每次尝试后,我都会检查生成的海报,看看图像和文字是否准确拼合,并根据发现的问题进行相应的调整和改进。在这个格式中,每个图像文件名后面跟着的是该图像在海报中的位置坐标,接下来是图标及其坐标,最后是文字的字体、颜色、大小、位置和具体内容。

2024-05-29 23:37:51 357

原创 项目实训第二周(尝试部署RainNet到pipeline)

通过对RainNet模型的学习和部署,我不仅深入理解了其工作原理和实现细节,还为后续的图像拼合工作打下了坚实的基础。尽管还有许多地方需要改进,但我对后续的开发工作充满信心,相信在接下来的时间里,我能够不断完善和优化我们的图像和谐化方法,为最终的海报生成提供更高质量的技术支持。其次,我对RainNet模型的超参数进行了微调,包括调整学习率、批量大小等,以提高模型的鲁棒性和泛化能力。接下来,我对现有的pipeline进行了必要的调整,使其能够接受和处理RainNet模型的输入和输出。

2024-05-29 23:35:21 284

原创 项目实训第一周记录(调研与设计)

它采用了一种基于卷积神经网络的架构,能够在不同的图像元素之间建立起复杂的关联,从而实现高质量的图像和谐化效果。然而,在我们现有的数据中并没有现成的mask,因此我向队友提出了生成mask的需求。通过对不同方法的深入研究和分析,我最终选择了RainNet作为我们的图像和谐化方案,并设计了一套完整的图像处理流程。虽然在这个过程中遇到了一些挑战,但通过不断尝试和调整,我逐步解决了这些问题,并为后续的开发工作打下了坚实的基础。在这一周的工作中,我不仅学到了许多关于图像和谐化的知识,还积累了丰富的实践经验。

2024-05-29 23:27:52 616

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除