weixin_43156294的博客

图像生成

关注

文章平均质量分 91

关注数：文章数：15 文章阅读量：22428 文章收藏量：276

作者: deepdata_cn

极深数据，深耕数据行业。

展开

图像风格迁移算法（Neural Style Transfer）

图像风格迁移算法（Neural Style Transfer）是一种基于深度学习的算法，将一幅图像的风格迁移到另一幅图像上，同时保留原始图像的内容，从而创造出具有独特艺术风格的新图像。Leon A. Gatys、Alexander S. Ecker和Matthias Bethge在2015年发表了“A neural algorithm of artistic style”论文，提出了神经风格迁移算法。

原创 2025-04-21 08:45:24 · 1206 阅读 · 0 评论
轻量动态水印库（alimask）

alimask：这是一个轻量级的 JavaScript 库，专门用于在网页上生成类似阿里巴巴内部网站的动态水印图片。它使用 HTML5 的 canvas 元素来绘制水印，通过简单的 API 即可生成带有自定义文本和属性的水印图片，水印的颜色、透明度、字体大小以及图片尺寸等都可以灵活调整。项目地址：https://gitcode.com/hustcc/alimask可以通过命令进行安装，然后使用几行简单的代码即可生成自定义水印。

原创 2024-12-13 07:30:00 · 1037 阅读 · 0 评论
在图片上创建水印（watermark.js）

watermark.js是一个用于在图片上添加水印的JavaScript库。它提供了一种方便的方式来保护图片版权或者为图片添加标识信息。1.功能特点灵活的水印内容：可以是文本、图像或者它们的组合。对于文本水印，用户可以自定义文字内容、字体、字号、颜色、透明度等。例如，您可以将公司名称、版权声明等作为文本水印添加到图片上。如果是图像水印，能够指定水印图像的路径和大小等参数。位置控制：能够精确控制水印在图片上的位置。

原创 2024-12-09 07:45:00 · 1586 阅读 · 0 评论
“盲水印”工具（Blind_watermark）

Blind_watermark项目利用先进的图像处理和机器学习技术，在不影响原图视觉效果的前提下，为图片添加难以察觉的 “盲水印”。其核心在于创新的水印嵌入和提取算法，包括数据预处理、频域编码、深度学习模型等，并且具有良好的鲁棒性，对常见的图像处理有抵抗能力，不容易被移除。

原创 2024-12-07 07:45:00 · 1471 阅读 · 0 评论
自回归视觉生成（OpenMAGVIT2）

OpenMAGVIT2通过改进原有的VQGAN架构，克服代码本大小限制及利用率低的问题，全面提升自回归视觉生成的质量与效率，实现自动回归视觉生成的民主化。产生了一个开源的Google MAGVITv2分词器的复制，这是一个具有超大规模词汇表（即，2182^{18}218个代码）的分词器，并在ImageNet 256x256上实现了最先进的重建性能（1.17 rFID）。2.技术分析。

原创 2024-12-01 07:30:00 · 770 阅读 · 0 评论
开源3D软件包（Blender）

Blender是一个免费且开源的3D软件包，支持场景建模和渲染等功能，可以通过Python脚本引擎自动化执行构建和变形网格或渲染图像序列等活动。它被用于生成合成测试图像以进行数字图像相关性分析。用于创建动画电影、视觉效果、艺术作品、3D打印模型、交互式3D应用程序和视频游戏。Blender的发展历程较为曲折。它最初由荷兰动画工作室NeoGeo作为内部应用程序开发，并于1994年1月2日正式推出。1998年1月1日，作为SGI免费软件，被公开发布在网络上。

原创 2024-11-27 07:30:00 · 1324 阅读 · 0 评论
图像生成系统（DALLE）

DALLE：由OpenAI开发的DALLE是一个能够根据自然语言描述创建逼真图像和艺术的AI系统。尽管DALLE生成的图像在保真度上可能不如Stable Diffusion或Midjourney，但其优势在于简单性，并且编辑生成的图像比“重绘”图像更为简单。DALLE 不是开源的，OpenAI 提供了部分功能的 API 供开发者使用。这意味着开发者可以通过 API 来访问 DALLE 的图像生成能力，以创建自己的应用程序。

原创 2024-11-26 07:45:00 · 2331 阅读 · 0 评论
图像生成工具（Midjourney）

Midjourney以其低门槛和高上限被认为是大多数用户的最佳工具。它使用户能够通过文本提示生成非常详细和准确的图像。由总部位于旧金山的独立研究实验室 Midjourney, Inc. 开发。2022 年 7 月 12 日开始进入公开测试阶段。Midjourney 使用复杂的机器学习模型，当用户输入文本描述（即提示词）时，模型会分析提示词中的关键词和概念，然后利用从海量图像数据集中学到的模式来生成符合描述的图像。

原创 2024-11-24 07:45:00 · 1388 阅读 · 0 评论
AI证件照生成（HivisionIDPhotos）

HivisionIDPhotos是一个开源的 AI 项目，主要用于证件照的生成。它可以使用较低的配置，包括 CPU，通过 AI 模型工作流程，实现对多种用户拍照场景的识别、抠图与证件照生成。操作简单，效果较好。无需依赖 GPU，仅使用 CPU 即可快速完成操作，降低了对硬件设备的要求，方便用户在不同配置的设备上使用。

原创 2024-10-31 07:30:00 · 2362 阅读 · 0 评论
AI 图像生成器（Craiyon）

Craiyon是基于 DALLE Mini 的开源 AI 图像生成器，易于使用。它是由谷歌和Hugging Face的研究员们开发的人工智能图像生成工具。用户输入提示词后，可选择艺术、照片、绘画等风格，也可以使用“专家模式”添加否定词来指导模型避开特定内容。虽然它生成的图像可能不是最复杂或最逼真的，但对于一些简单的创意需求，它的表现还是不错的。

原创 2024-10-29 07:45:00 · 2070 阅读 · 0 评论
AI绘图模型（PaintsUNDO）

PaintsUNDO工具能够模拟真人将目标画作拆解成一步步绘画过程。由 AI 绘图圈大神、ControlNet 作者张吕敏（lvminzhang）开发。用户只需上传一张图片，就能让 AI 根据图片分解成相应步骤，然后录制成绘画过程视频，对于想要学习绘画过程或制作绘画教程的人来说非常有用。PaintsUndo 是一个创新的人工智能项目，它专注于模拟和理解人类在数字绘画中的绘图行为。该项目的愿景是开发出能够精确反映人类艺术家需求和行为的 AI 模型，以促进人工智能与人类艺术家之间更紧密、更自然的合作。

原创 2024-10-29 07:30:00 · 1261 阅读 · 0 评论
图像生成软件（Fooocus）

Fooocus是一款学习了 Stable Diffusion 的离线、开源和免费特点，以及 Midjourney 不需要用户进行参数调整优势的图像生成软件。采用 GPL v3 许可证，对硬件配置要求相对较低，只需要 4G 显存即可使用，旨在提供高质量的文本到图像的转换，同时简化用户的操作流程。2023 年 8 月 9 日首次发布。由斯坦福大学博士生张吕敏（lv min zhang）开发，他也是 ControlNet 论文的作者。

原创 2024-10-28 07:45:00 · 1544 阅读 · 0 评论
图像扩图工具（Diffusers Image Outpaint）

Diffusers Image Outpaint是一个专注于图像扩图的开源工具。它可以根据图像内容生成外部区域，使图像看起来更加自然和完整。操作方便，没有太多复杂的功能设置，非常适合新手，并且可以在本地离线运行。

原创 2024-10-23 07:30:00 · 1773 阅读 · 0 评论
开源图像生成器（AuraFlow）

AuraFlow由生成媒体公司 Falai 发布的开源图像生成器。经过大量训练，能够生成文本到图像的内容。它在不同的艺术风格和场景下都有较好的表现，并且遵循标准的 Apache 2.0 许可证，吸引了很多开发者的关注。不过，它对 GPU 的性能要求较高，需要大约 12GB 的显存才能运行其 FP16 版本。适合对图像质量和风格有较高要求的用户，可用于艺术创作、概念设计等方面。

原创 2024-10-20 07:45:00 · 1237 阅读 · 0 评论
开源图像生成（Stable Diffusion）

Stable Diffusion是目前非常知名且应用广泛的图像生成开源项目，具有变革性的开源人工智能图像生成模型。它能够根据用户输入的文本描述生成高质量、高分辨率的图像，具有很强的创造性和灵活性。用户可以通过调整各种参数，如采样步数、学习率、提示词权重等，来控制生成图像的风格和内容。广泛应用于艺术创作、设计、广告、动漫等领域，专业艺术家和设计师可以利用它快速生成创意灵感，普通用户也可以用它来制作独特的图像作品。

原创 2024-10-19 07:45:00 · 1083 阅读 · 0 评论