计算机视觉入门
文章平均质量分 73
多恩Stone
聚焦时尚设计领域的高可用 AIGC,现于香港理工-人工智能设计研究所搬砖
展开
-
【SVG 生成系列论文(八)】如何生成 svg logo?IconShop: 通过自回归 Transformer 实现文本引导的矢量 Icon 生成
论文名:IconShop: Text-Guided Vector Icon Synthesis with Autoregressive Transformers (Siggraph Asia 2023)文章提出的模型输入为文本,模型输出为单色的、相对简单的矢量图 icon。介绍了 SVG 表示与 Token 化、掩码方案,本篇则介绍模型架构和具体的训练技巧。原创 2024-05-21 16:42:37 · 616 阅读 · 0 评论 -
【SVG 生成系列论文(七)】如何生成 svg logo?IconShop: 通过自回归 Transformer 实现文本引导的矢量 Icon 生成
本文将进一步介绍技术细节:SVG 表示与 Token 化,以及掩码方案。论文名:IconShop: Text-Guided Vector Icon Synthesis with Autoregressive Transformers (Siggraph Asia 2023)文章提出的模型输入为文本,模型输出为单色的、相对简单的矢量图 icon。原创 2024-05-21 15:18:09 · 474 阅读 · 0 评论 -
【SVG 生成系列论文(六)】如何生成 svg logo?IconShop: 通过自回归 Transformer 实现文本引导的矢量 Icon 生成
在本文中,我们将继续介绍一种非优化方法(直接生成 SVG 代码)的技术路线,这项工作名为 IconShop。IconShop 是在 StarVector 之前的同类研究,为这一技术路线的发展奠定了基础。本篇简要介绍背景和应用,后续文章将进一步介绍技术细节与相关代码。原创 2024-05-21 10:43:58 · 379 阅读 · 0 评论 -
【SVG 生成系列论文(一)】用 LLM 来生成 SVG 代码,StarVector: Generating Scalable Vector Graphics Code from Images
背景:可伸缩矢量图形(Scalable Vector Graphics,SVG)已经成为现代图像渲染应用程序中不可或缺的一部分,因为它们具有。方法:StarVector 是一种多模态SVG生成模型,它有效地集成了代码生成大型语言模型(CodeLLMs)和视觉模型。从以下对比中可以看出,StarVector 和 GPT-4 V 有类似的 SVG 生成功能。存在的问题:现有的使用深度学习进行SVG建模的方法通常难以生成复杂的SVG,并且仅限于需要。任务: 输入一张位图,输出一张位图对应的 SVG 矢量图。原创 2024-05-08 22:05:27 · 535 阅读 · 0 评论 -
【已解决】To enable repo look-ups and downloads online, pass ‘local_files_only=False‘ as input.
根据 config.yaml 中的提示“# Set this variable to True the first time it runs”,在 config.yaml 配置文件中将 diffuser 的 download 参数设置为例 True 后解决该问题。原创 2024-04-23 19:16:11 · 329 阅读 · 0 评论 -
【 AIGC 研究最新方向(下)】面向平面、视觉、时尚设计的高可用 AIGC 研究方向总结
目前面向平面、视觉、时尚等设计领域的高可用 AIGC 方向有以下 4 种:1. 透明图层生成,2. 可控生成,3. 图像定制化,4. SVG 生成原创 2024-04-21 23:36:02 · 1027 阅读 · 0 评论 -
2.4微分(动手深度学习v2)
学习目标:动手深度学习V2(进度:7/73)学习内容:小结微分和积分是微积分的两个分支,其中前者可以应用于深度学习中无处不在的优化问题。导数可以被解释为函数相对于其变量的瞬时变化率。它也是函数曲线的切线的斜率。梯度是一个向量,其分量是多变量函数相对于其所有变量的偏导数。链式法则使我们能够微分复合函数。学习时间:周一至周五晚上 7 点—晚上9点学习产出:本文练习题1. 绘制函数 f(x)=x3−1xf ( x ) = x ^ { 3 } - \frac { 1 } { x }f(原创 2021-09-12 10:06:16 · 264 阅读 · 0 评论 -
2.3线性代数(动手深度学习v2)
学习目标:动手深度学习V2(进度:6/73)学习内容:标量、向量、矩阵和张量是线性代数中的基本数学对象。向量泛化自标量,矩阵泛化自向量。标量、向量、矩阵和张量分别具有零、一、二和任意数量的轴。一个张量可以通过sum和mean沿指定的轴降低维度。两个矩阵的按元素乘法被称为他们的哈达玛积。它与矩阵乘法不同。在深度学习中,我们经常使用范数,如 L1 范数、 L2 范数和弗罗贝尼乌斯范数。我们可以对标量、向量、矩阵和张量执行各种操作。学习时间:2021.9.4( 10:40-11:20am原创 2021-09-04 11:09:59 · 427 阅读 · 0 评论 -
2.2数据预处理(动手深度学习v2)
课程主页:https://courses.d2l.ai/zh-v2/教材:https://zh-v2.d2l.ai/练习1. 删除缺失值最多的列。2. 将预处理后的数据集转换为张量格式。数据预处理????sec_pandas到目前为止,我们已经介绍了处理存储在张量中数据的各种技术。为了能用深度学习来解决现实世界的问题,我们经常从预处理原始数据开始,而不是从那些准备好的张量格式数据开始。在Python中常用的数据分析工具中,通常使用pandas软件包。像庞大的Python生态系统中的许多其他扩展原创 2021-09-02 10:48:48 · 784 阅读 · 0 评论 -
Baidu AI Studio李宏毅课程-生成对抗网络>项目1 基于openCV的人脸检测
任务描述使用OpenCV中的CascadeClassifier进行人脸检测,下载预训练权重,权重文件格式为xml。在安装opencv的时候在其目录下data文件夹内,存放着权重描述文件。下方是一个检测的例子,阅读代码并尝试修改,上传任务图像,完成检测。输入图片:识别后结果:图片来源google搜索“毕业照”,若侵删。代码如下import cv2import sysimport os.pathdef detect(filename, cascade_file = "/opt/cond原创 2021-03-29 15:14:36 · 341 阅读 · 2 评论