
图像生成
文章平均质量分 91
deepdata_cn
极深数据,深耕数据行业。
展开
-
图像风格迁移算法(Neural Style Transfer)
图像风格迁移算法(Neural Style Transfer)是一种基于深度学习的算法,将一幅图像的风格迁移到另一幅图像上,同时保留原始图像的内容,从而创造出具有独特艺术风格的新图像。Leon A. Gatys、Alexander S. Ecker和Matthias Bethge在2015年发表了“A neural algorithm of artistic style”论文,提出了神经风格迁移算法。原创 2025-04-21 08:45:24 · 1206 阅读 · 0 评论 -
轻量动态水印库(alimask)
alimask:这是一个轻量级的 JavaScript 库,专门用于在网页上生成类似阿里巴巴内部网站的动态水印图片。它使用 HTML5 的 canvas 元素来绘制水印,通过简单的 API 即可生成带有自定义文本和属性的水印图片,水印的颜色、透明度、字体大小以及图片尺寸等都可以灵活调整。项目地址:https://gitcode.com/hustcc/alimask可以通过命令进行安装,然后使用几行简单的代码即可生成自定义水印。原创 2024-12-13 07:30:00 · 1037 阅读 · 0 评论 -
在图片上创建水印(watermark.js)
watermark.js是一个用于在图片上添加水印的JavaScript库。它提供了一种方便的方式来保护图片版权或者为图片添加标识信息。1.功能特点灵活的水印内容:可以是文本、图像或者它们的组合。对于文本水印,用户可以自定义文字内容、字体、字号、颜色、透明度等。例如,您可以将公司名称、版权声明等作为文本水印添加到图片上。如果是图像水印,能够指定水印图像的路径和大小等参数。位置控制:能够精确控制水印在图片上的位置。原创 2024-12-09 07:45:00 · 1586 阅读 · 0 评论 -
“盲水印”工具(Blind_watermark)
Blind_watermark项目利用先进的图像处理和机器学习技术,在不影响原图视觉效果的前提下,为图片添加难以察觉的 “盲水印”。其核心在于创新的水印嵌入和提取算法,包括数据预处理、频域编码、深度学习模型等,并且具有良好的鲁棒性,对常见的图像处理有抵抗能力,不容易被移除。原创 2024-12-07 07:45:00 · 1471 阅读 · 0 评论 -
自回归视觉生成(OpenMAGVIT2)
OpenMAGVIT2通过改进原有的VQGAN架构,克服代码本大小限制及利用率低的问题,全面提升自回归视觉生成的质量与效率,实现自动回归视觉生成的民主化。产生了一个开源的Google MAGVITv2分词器的复制,这是一个具有超大规模词汇表(即,2182^{18}218个代码)的分词器,并在ImageNet 256x256上实现了最先进的重建性能(1.17 rFID)。2.技术分析。原创 2024-12-01 07:30:00 · 770 阅读 · 0 评论 -
开源3D软件包(Blender)
Blender是一个免费且开源的3D软件包,支持场景建模和渲染等功能,可以通过Python脚本引擎自动化执行构建和变形网格或渲染图像序列等活动。它被用于生成合成测试图像以进行数字图像相关性分析。用于创建动画电影、视觉效果、艺术作品、3D打印模型、交互式3D应用程序和视频游戏。Blender的发展历程较为曲折。它最初由荷兰动画工作室NeoGeo作为内部应用程序开发,并于1994年1月2日正式推出。1998年1月1日,作为SGI免费软件,被公开发布在网络上。原创 2024-11-27 07:30:00 · 1324 阅读 · 0 评论 -
图像生成系统(DALLE)
DALLE:由OpenAI开发的DALLE是一个能够根据自然语言描述创建逼真图像和艺术的AI系统。尽管DALLE生成的图像在保真度上可能不如Stable Diffusion或Midjourney,但其优势在于简单性,并且编辑生成的图像比“重绘”图像更为简单。DALLE 不是开源的,OpenAI 提供了部分功能的 API 供开发者使用。这意味着开发者可以通过 API 来访问 DALLE 的图像生成能力,以创建自己的应用程序。原创 2024-11-26 07:45:00 · 2331 阅读 · 0 评论 -
图像生成工具(Midjourney)
Midjourney以其低门槛和高上限被认为是大多数用户的最佳工具。它使用户能够通过文本提示生成非常详细和准确的图像。由总部位于旧金山的独立研究实验室 Midjourney, Inc. 开发。2022 年 7 月 12 日开始进入公开测试阶段。Midjourney 使用复杂的机器学习模型,当用户输入文本描述(即提示词)时,模型会分析提示词中的关键词和概念,然后利用从海量图像数据集中学到的模式来生成符合描述的图像。原创 2024-11-24 07:45:00 · 1388 阅读 · 0 评论 -
AI证件照生成(HivisionIDPhotos)
HivisionIDPhotos是一个开源的 AI 项目,主要用于证件照的生成。它可以使用较低的配置,包括 CPU,通过 AI 模型工作流程,实现对多种用户拍照场景的识别、抠图与证件照生成。操作简单,效果较好。无需依赖 GPU,仅使用 CPU 即可快速完成操作,降低了对硬件设备的要求,方便用户在不同配置的设备上使用。原创 2024-10-31 07:30:00 · 2362 阅读 · 0 评论 -
AI 图像生成器(Craiyon)
Craiyon是基于 DALLE Mini 的开源 AI 图像生成器,易于使用。它是由谷歌和Hugging Face的研究员们开发的人工智能图像生成工具。用户输入提示词后,可选择艺术、照片、绘画等风格,也可以使用“专家模式”添加否定词来指导模型避开特定内容。虽然它生成的图像可能不是最复杂或最逼真的,但对于一些简单的创意需求,它的表现还是不错的。原创 2024-10-29 07:45:00 · 2070 阅读 · 0 评论 -
AI绘图模型(PaintsUNDO)
PaintsUNDO工具能够模拟真人将目标画作拆解成一步步绘画过程。由 AI 绘图圈大神、ControlNet 作者张吕敏(lvminzhang)开发。用户只需上传一张图片,就能让 AI 根据图片分解成相应步骤,然后录制成绘画过程视频,对于想要学习绘画过程或制作绘画教程的人来说非常有用。PaintsUndo 是一个创新的人工智能项目,它专注于模拟和理解人类在数字绘画中的绘图行为。该项目的愿景是开发出能够精确反映人类艺术家需求和行为的 AI 模型,以促进人工智能与人类艺术家之间更紧密、更自然的合作。原创 2024-10-29 07:30:00 · 1261 阅读 · 0 评论 -
图像生成软件(Fooocus)
Fooocus是一款学习了 Stable Diffusion 的离线、开源和免费特点,以及 Midjourney 不需要用户进行参数调整优势的图像生成软件。采用 GPL v3 许可证,对硬件配置要求相对较低,只需要 4G 显存即可使用,旨在提供高质量的文本到图像的转换,同时简化用户的操作流程。2023 年 8 月 9 日首次发布。由斯坦福大学博士生张吕敏(lv min zhang)开发,他也是 ControlNet 论文的作者。原创 2024-10-28 07:45:00 · 1544 阅读 · 0 评论 -
图像扩图工具(Diffusers Image Outpaint)
Diffusers Image Outpaint是一个专注于图像扩图的开源工具。它可以根据图像内容生成外部区域,使图像看起来更加自然和完整。操作方便,没有太多复杂的功能设置,非常适合新手,并且可以在本地离线运行。原创 2024-10-23 07:30:00 · 1773 阅读 · 0 评论 -
开源图像生成器(AuraFlow)
AuraFlow由生成媒体公司 Falai 发布的开源图像生成器。经过大量训练,能够生成文本到图像的内容。它在不同的艺术风格和场景下都有较好的表现,并且遵循标准的 Apache 2.0 许可证,吸引了很多开发者的关注。不过,它对 GPU 的性能要求较高,需要大约 12GB 的显存才能运行其 FP16 版本。适合对图像质量和风格有较高要求的用户,可用于艺术创作、概念设计等方面。原创 2024-10-20 07:45:00 · 1237 阅读 · 0 评论 -
开源图像生成(Stable Diffusion)
Stable Diffusion是目前非常知名且应用广泛的图像生成开源项目,具有变革性的开源人工智能图像生成模型。它能够根据用户输入的文本描述生成高质量、高分辨率的图像,具有很强的创造性和灵活性。用户可以通过调整各种参数,如采样步数、学习率、提示词权重等,来控制生成图像的风格和内容。广泛应用于艺术创作、设计、广告、动漫等领域,专业艺术家和设计师可以利用它快速生成创意灵感,普通用户也可以用它来制作独特的图像作品。原创 2024-10-19 07:45:00 · 1083 阅读 · 0 评论