海报生成
文章平均质量分 88
远洋之帆
机器学习 人工智能 数学 数据可视化 机器人
展开
-
用大模型实现PPT可视化几种思路
他们大致的思路是:用户内容如何呈现应是需要对用户内容理解选择合适的呈现方式,生成内容可视呈现计划大纲,然后对每部分的内容细化充分的分析挖掘ppt工具的属性来做细粒度优化呈现。充分的理解PPT这种工具的可视化呈现优势,对每部分的素材生成合适的呈现效果,比如:大小、颜色、动效,前后颜色搭配,颜色比对,图表…对于如何根据用户输入的信息做信息的整理组织,然后把整理组织信息作排版,生成合适的PPt呈现不是重点介绍对象。这种实现方式已经对ppt信息可视化做了一层建模,会对用户的输入做理解,重新组合生成合适的呈现方式。原创 2024-06-07 12:31:46 · 2920 阅读 · 0 评论 -
用大模型搭建一个自己的新闻小助手
这篇文章选择用字节开放的“扣子”编排工具来实现,DIfy、autoagent、chatglm、langflow理论上讲都可以实现。但是扣子目前提供的工具插件、以及工作流我觉得是比较容易上手的。并且很多插件是免费使用、把各种API使用需要的权限申请和配置问题解决了。所以这次实践选择用“扣子”来实现。原创 2024-05-28 19:04:59 · 907 阅读 · 1 评论 -
Learn to Paint 光栅图转矢量图生成
https://github.com/liangwq/Chatglm_lora_multi-gpu/tree/main/APP_example平滑矢量图形综述:表示、创建、光栅化和图像矢量化的最新进展无偏扭曲区域采样在可微分渲染中的应用可微分矢量图形光栅化用于编辑和学习图片逐层矢量类人笔触的模型风格化绘画CLIPDraw:通过语言-图像编码器探索文本到绘图合成根据参考风格进行矢量图绘制基于语义感知的对象草图绘制具有不同类型和抽象级别的场景素描通过潜在扩散模型实现文本引导矢量草图合成使用扩散原创 2024-05-23 10:04:54 · 813 阅读 · 0 评论 -
使用神经实现路径表示的文本到向量生成
给定一个文本提示,我们的目标是生成一个与文本提示的语义一致且表现出令人满意的路径属性和与人类感知一致的分层结构的SVG。由于SVG由一组路径组成,表示为SVGPath1Path2PathmSVGPath1Path2...Pathm,我们的目标是根据文本提示TTT通过以下方式优化mmm条路径:神经路径表示学习(第4节)路径几何由连接的三次贝塞尔曲线组成。我们的目标是通过将每条路径映射到一个表示为zzz。原创 2024-05-22 10:12:28 · 273 阅读 · 0 评论 -
使用扩散模型进行文本引导的SVG生成
图7:展示我们SVGDreamer生成的结果的可编辑性的例子。这份补充材料被组织成几个部分,提供了与我们在SVGDreamer方面的工作相关的额外细节和分析。在A部分,我们将展示SVGDreamer的更多定性结果,展示它能够生成具有高可编辑性、视觉质量和多样性的SVG。在B部分,我们将展示SVGDreamer在海报设计和图标设计方面的潜在应用。在C部分,我们将提供SVGDreamer的更多实现细节。在D部分,我们将解释如何在SIVE提示中识别语义对象。原创 2024-05-21 09:57:46 · 478 阅读 · 0 评论 -
根据参考风格进行矢量图绘制
利用机器学习根据给定的文本描述生成图像的技术已经取得了显著的进步,例如CLIP图像-文本编码器模型的发布;然而,当前的方法缺乏对生成图像风格的艺术控制。我们提出了一种方法,用于为给定的文本描述生成指定风格的绘图,用户可以通过一个样本图像来指定所需的绘图风格。受到艺术理论的启发,该理论认为在创作过程中风格和内容通常是不可分割的,我们提出了一个耦合的方法,称为StyleCLIPDraw,通过在整个过程中同时优化风格和内容来生成绘图,而不是在创建内容后应用风格转移。原创 2024-05-15 10:01:33 · 413 阅读 · 0 评论 -
类人笔触的模型风格化绘画
图2展示了我们方法的概览。给定一个空的画布ℎ0,我们逐步绘制并叠加在每一步渲染的笔画。在每一步绘制中,一个训练好的神经渲染器𝐺接受一组笔画参数𝒙𝑡(例如,形状、颜色、透明度和纹理),并产生一个笔画前景𝑠𝑡和一个alpha蒙版𝛼𝑡。然后我们使用软混合来混合画布、前景和alpha蒙版,并确保整个渲染过程是可微分的。软混合定义如下:其中(𝑠𝑡, 𝛼𝑡) = 𝐺(𝒙𝑡)。我们最终从所有步骤中收集笔画参数,并通过在笔画参数空间内搜索来优化它们。原创 2024-05-13 14:26:54 · 1439 阅读 · 0 评论 -
字就是图,实现语义排版
“字即图”是一种语义排版技术,其中的单词插图展示了单词意义的可视化,同时保持了其可读性。我们提出了一种自动创建“字即图”插图的方法。这项任务极具挑战性,因为它需要对单词的语义理解以及如何在视觉上令人愉悦且清晰地描绘这些语义的创造性想法。我们依赖于最近大型预训练语言-视觉模型的卓越能力,将文本概念视觉化。我们专注于简单、简洁、黑白的设计,以清晰地传达语义。我们故意不改变字母的颜色或纹理,也不使用装饰。我们的方法通过预训练的Stable Diffusion模型指导,优化每个字母的轮廓以传达所需的概念。原创 2024-05-10 10:27:10 · 1037 阅读 · 0 评论 -
把现实场景转成动漫风格360场景
用controlnet+stablediffuion做360vr场景生成原创 2023-02-26 21:23:21 · 608 阅读 · 0 评论 -
多模态预训练模型综述
本文就对多模态预训练模型做了整理,从多模态预训练大模型主要包括以下4个方面:1.多模态众原始输入图、文数据表示:将图像和文本编码为潜在表示,以保留其语义2.多模态数据如何交互融合:设计一个优秀架构来交叉多模态信息之间的相互作用3.多模态预训练大模型如何学习萃取有效知识:设计有效的训练任务来让模型萃取信息4.多模态预训练大模型如何适配下游任务:训练好的预训练模型fintune适配下游任务原创 2023-02-26 10:31:33 · 3281 阅读 · 0 评论 -
Ai作画studio环境布置
如何布置自己的ai作图环境原创 2023-02-24 14:46:05 · 1831 阅读 · 0 评论 -
打造Ai作图studio需要哪些工具
Ai作图要做出一个稳定高质量的图片需要哪些工具,作为Ai作图的公司该如何为自己的studio配备工具。原创 2023-02-21 15:35:33 · 3333 阅读 · 1 评论 -
AI稳定生成图工业链路打造
AI生成图片,如何打造建立一套稳定的工业生产链路原创 2023-02-20 17:46:04 · 2331 阅读 · 9 评论 -
教你文本生成图片——stablediffusion
文本生成图片,单一物体生成原创 2023-02-13 22:33:15 · 5400 阅读 · 1 评论 -
AIGC在营销图片生成技术综述
AIGC在营销素材生成中技术介绍,和实例尝试原创 2023-01-29 16:02:19 · 2745 阅读 · 5 评论 -
prompt learning受控文本生成作诗
小样本学习难点在于:1.数据量较少,比如10-16个样本2.fintune后接后置任务模型层,参数比较多可以把这个问题看成是矩阵求解时候的,函数参数比较多、但是方程等式较少,这样求解方程组会导致方程组的解有很多种,那如何选出符合业务最优解就是个难题,如果随机的选很容易出现选出一个泛化力不够的解。针对这种问题一般的解法有三:1.增加更多的等式——>增加数据量2.增加约束条件,让函数参数减少——>引入注意力机制3.正样本数据少,但有负样本拒绝条件——>数据增强+拒绝采样历史的fintune,就相当于用足够多的样原创 2022-07-04 14:46:05 · 1118 阅读 · 0 评论 -
短视频封面抽取和标题自动化生成
人像抽取部分0.视频字幕去除# 安装 AgentOCR!pip install agentocr# 安装 CPU 版本 ONNXRuntime!pip install onnxruntimeimport cv2import numpy as npfrom PIL import Imageimport matplotlib.pyplot as pltdef image_remove_word(img_path = 'images/frame.177000000.jpg'):..原创 2022-05-07 07:56:03 · 2129 阅读 · 0 评论 -
智能生成海报的一些思考
图片解构一张首图海报可以解析成以下4个部分:1.背景图:区分内容边界,吸引眼球2.图元素:装饰、表意3.文字:传递有效信息4.结构:层次化突出重点,图层顺序、元素布局(尺寸、大小、位置)图的主要包括三个层面:形、区块、素(色、质、纹理、光、位、寸、形),这三个层面可以是嵌套多层关系。所以每个部分图的生成,都可以根据以上3个层面、7个控制变量去控制组合生成更多样的图元素。背景生成思路背景的主要作用就是做边界区隔,把观众的注意立带入这个区域;所以背景图本身只要能区..原创 2021-04-23 15:16:17 · 626 阅读 · 0 评论