Learn to Paint 光栅图转矢量图生成-CSDN博客

本文链接：https://blog.csdn.net/liangwqi/article/details/139139639

这个系列项目代码实现：

https://github.com/liangwq/Chatglm_lora_multi-gpu/tree/main/APP_example

Lean to 矢量生成

前面部分回顾了下通过learn的方式来求解图片矢量。现在的learn方式更多是体现的给定光栅图、控制条件来求解矢量模型参数。目前还没有看到类似文本生成图片的生成大模型的，直接通过文本引导生成矢量图的大模型。
在接下来的系列会介绍上面论文的代码实践。先介绍论文主要算法实现，然后介绍代码的应用实例。下面以Diffvg作为这个系列的开场。

Diffvg+html矢量图生成

核心类实现

optimize_svg

这份代码是一个复杂的Python脚本，用于解析和优化SVG（可缩放矢量图形）文件。它包含多个类和方法，用于处理SVG文件的不同部分，如形状、颜色、变换和渐变。下面是对代码的主要部分的解释：

导入模块：

代码开始时导入了多个Python标准库和第三方库，如json, copy, xml.etree.ElementTree, torch, numpy, pydiffvg等，这些库用于处理文件、数据复制、XML解析、机器学习、数值计算和图形渲染。

SvgOptimizationSettings类：

这个类定义了SVG优化的默认参数，如颜色优化、透明度优化、变换优化等。它还包含一个字典optims，用于存储不同优化器的实现。

OptimizableSvg类：

这个类是主要的SVG处理类，它包含了多个子类和方法，用于解析和优化SVG文件。它包括处理SVG节点、形状、变换、渐变等的子类和方法。

SVG节点类：

包括SvgNode, GroupNode, RootNode, ShapeNode, PathNode, RectNode, CircleNode, EllipseNode, PolygonNode, GradientNode等。这些类用于表示SVG文件中的不同类型的节点，如根节点、组节点、形状节点等。

优化器类：

包括ColorOptimizer, StopOptimizer, GradientOptimizer, TransformOptimizer等。这些类用于优化SVG中的颜色、渐变停止点、渐变和变换。

解析和写入方法：

代码中包含了许多方法，用于解析SVG文件的不同部分（如形状、变换、渐变等），并将优化后的结果写回到XML格式。

优化和渲染：

代码提供了方法来优化SVG文件中的元素，并通过pydiffvg库渲染优化后的SVG图形。

解析SVG文件，还能够对其进行优化，并通过机器学习方法（如PyTorch）来调整SVG元素的属性，最终生成优化后的SVG图形。这对于需要处理和优化大量SVG文件的应用场景非常有用。

它定义了一个名为OptimizableSvg的类，用于处理和优化SVG（Scalable Vector Graphics）图像。程序使用了PyTorch库来执行数值计算和优化。以下是代码的主要组成部分和功能的详细解释：

类定义和属性

SvgOptimizationSettings：这个类用于存储SVG优化的设置，例如颜色优化、透明度优化、变换优化等。它包含了默认参数和优化器的映射。
OptimizableSvg：这是主要的类，用于表示和优化SVG图像。它包含了一系列方法来解析SVG文件、构建场景、执行优化步骤以及渲染图像。

核心功能

parseRoot(root)：解析SVG文件的根元素，初始化画布尺寸、转换和外观。
parseShape(shape, parent)：根据SVG中的不同形状（如路径、圆形、矩形等），调用相应的解析函数。
parseTransform(node)：解析SVG节点中的变换属性。
parseAppearance(node, defs, device)：解析SVG节点的外观属性，如填充颜色、透明度等。
build_scene()：根据解析的SVG数据构建场景，准备进行渲染或优化。
render(scale=None, seed=0)：渲染场景，生成图像。
step()：执行优化步骤，更新SVG属性。

辅助功能

TransformTools：一个嵌套类，提供了一系列静态方法来处理SVG变换，如解析矩阵、应用变换到点等。
ColorOptimizer、StopOptimizer、GradientOptimizer、TransformOptimizer：这些嵌套类用于优化SVG的不同属性，如颜色、渐变停止点、渐变属性和变换。

SVG节点

SvgNode：一个抽象基类，定义了SVG节点的基本结构和行为。
GroupNode、RootNode、ShapeNode、PathNode、RectNode、CircleNode、EllipseNode、PolygonNode、GradientNode：这些类继承自SvgNode，代表SVG中的不同类型节点，并实现了具体的构建场景和写入XML的方法。

写入和报告

write_xml()：将优化后的SVG节点写入XML格式。
write_defs(root)：写入SVG定义（如渐变、样式等）。
reportSkippedAttribs(node, non_skipped=[])：报告在解析过程中跳过的SVG属性。
reportSkippedChildren(node, skipped)：报告在解析过程中跳过的子节点。

其他

unit_dict：一个字典，用于将SVG中的尺寸单位转换为像素。
parseLength(s)、parseOpacity(s)、parse_color(s)：这些静态方法用于解析SVG中的尺寸、透明度和颜色。

整体来看，这个程序提供了一个完整的框架来加载SVG文件，对其进行解析、优化和重新生成。它特别适用于需要对SVG图像进行数值优化的场景，例如在计算机图形学和机器学习应用中。

render_pytorch

代码是一个基于PyTorch框架的渲染库，使用了diffvg和pydiffvg库来实现矢量图的前向渲染和反向梯度传播。它主要用于生成和操作具有艺术效果的图像，例如绘画风格或者设计图案。下面是代码的主要功能和实现逻辑的详细解释：

主要功能

矢量图渲染：将矢量图形（如圆形、椭圆形、路径、多边形和矩形）渲染成位图图像。
多种输出类型：支持颜色图像和符号距离场（SDF）两种输出类型。
渐变填充：支持线性渐变和径向渐变作为填充颜色。
笔触宽度和样式：可以设置矢量图形的笔触宽度，并选择是否使用距离近似。
分组和混合规则：支持将多个形状分组，并使用非零规则或偶奇规则进行渲染。
前向渲染和梯度传播：能够进行前向渲染以生成图像，并计算梯度以进行反向传播，这对于训练生成模型或优化图形参数非常有用。

实现逻辑

RenderFunction 类：这是一个PyTorch Function，它封装了与diffvg库交互的逻辑。
- serialize_scene 方法：将场景中的图形和形状分组序列化为一个参数列表，以便在PyTorch中使用。
- forward 方法：执行前向渲染，生成图像或SDF。
- render_grad 方法：在给定梯度图像的情况下，计算场景中各个元素的梯度。
- backward 方法：执行反向传播，计算图形参数的梯度。
场景构建：在forward和render_grad方法中，首先构建一个diffvg.Scene对象，该对象包含了渲染所需的所有信息，如图形、形状分组、滤镜等。
渲染过程：使用diffvg.render函数执行实际的渲染操作。这个函数处理了光线追踪、栅格化等底层细节。
参数序列化与反序列化：为了与PyTorch的自动微分系统兼容，需要将场景中的图形和参数序列化为一个扁平化的参数列表，并在前向和后向传递中进行反序列化。
梯度传播：在backward方法中，根据diffvg库提供的梯度信息，计算并返回每个图形参数的梯度。