自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AIGC Studio:分享AIGC前沿知识和好玩应用,公众号同名。

计算机硕士,人工智能领域优质创作者,从事深度学习、计算机视觉、图像处理相关工作,目前关注于AIGC文生图,图生图,文生视频等方向。曾在滴滴,小米任职算法工程师。

  • 博客(375)
  • 资源 (21)
  • 收藏
  • 关注

原创 AWPortrait1.4更新,人物的生成更加趋近真实感,将SD1.5人像的真实感提升到了一个新的高度

AWPortrait1.4更新,人物的生成更加趋近真实感,将SD1.5人像的真实感提升到了一个新的高度经过5个月,AWPortrait终于迎来了1.4。本次更新基于1.3训练,使得人物的生成更加趋近真实感,将SD1.5人像的真实感提升到了一个新的高度。AWPortrait1.4的人物生成效果很真实。增加了旗袍、汉服等东方元素,更好的棚拍效果及户外效果;优化了close up下的特写人物五官容易造成畸形的情况;可更改人物年龄,比较稳定的输出效果是10-80岁;

2024-05-24 21:28:40 263

原创 Controlnet作者放出新的大招 IC-Light,可以操控图像生成时的光照,对内容主体重新打光生成符合新背景环境光照的图片

IC-Light代表Impose Constant Light,是一个控制图像照明的项目。可以操控图像生成时的光照,对内容主体重新打光生成符合新背景环境光照的图片。这下商品图合成这种需要最大程度保持原有主体 ID 需求的最大的问题解决了。目前,已经发布了两种类型的模型:文本条件重新光照模型。从原图分离主体之后通过提示词生成符合光照要求的背景同时主体除了光照之外和原主体一致。背景条件模型。给定背景图片和前景主体,会自动生成环境光,保证背景和前景的融合。

2024-05-24 21:26:28 437

原创 优于InstantID!中山大学提出ConsistentID:可以仅使用单个图像根据文本提示生成不同的个性化ID图像

基于扩散的技术已经取得了重大进展,特别是在个性化和定制的设施生成方面。然而,现有方法在实现高保真和详细身份(ID)一致性方面面临挑战,这主要是由于对面部区域的细粒度控制不足,以及缺乏通过充分考虑错综复杂的面部细节和整体面部来保存ID的全面策略。为了解决这些限制,我们引入了ConsistentID,这是一种创新的方法,专门用于在细粒度多模式面部提示下生成不同身份的人像,仅使用单个参考图像。

2024-05-24 21:23:34 562

原创 FIFO-Diffusion,一个无需额外训练即可生成长视频的框架。通过确保每个帧引用足够多的先前帧来生成高质量、一致的长视频。

我们提出了一种基于预训练扩散模型的新颖推理技术,用于文本条件视频生成。我们的方法称为 FIFO-Diffusion,从概念上讲,无需训练即可生成无限长的视频。这是通过迭代执行对角去噪来实现的,该去噪同时处理队列中噪声级别不断增加的一系列连续帧;我们的方法在头部将完全去噪的帧出队,同时在尾部将新的随机噪声帧入队。然而,对角去噪是一把双刃剑,因为靠近尾部的帧可以通过前向参考利用更干净的帧,但这种策略会导致训练和推理之间的差异。

2024-05-24 21:19:38 517

原创 南加州大学&字节提出MagicPose,提供逼真的人类视频生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。

在这项工作中,我们提出了MagicPose,这是一种基于扩散的模型,用于在具有挑战性的人舞视频中进行2D人体动作和面部表情的转移。具体来说,我们的目标是生成由新颖的姿势序列驱动的任何目标身份的人舞视频,同时保持身份不变。为此,我们提出了一种两阶段的训练策略,以分离人体动作和外观(例如面部表情、肤色和着装),包括对同一数据集的人舞姿势的外观控制块的预训练和对外观-姿势-联合控制块的精细调整。我们的新颖设计使外观控制具有在时间上一致的上半身、面部属性甚至背景。

2024-05-23 20:14:03 617

原创 当前最好的SD边线提取工具Anyline:一个快速,准确,详细的线检测预处理器,提供ComfyUI和SD WebUI版本。

Anyline 与 Mistoline ControlNet 模型相结合,形成完整的 SDXL 工作流程,最大限度地提高精确控制并利用 SDXL 模型的生成能力。Anyline 还可以与 SD1.5 的 ControlNet 一起用于 SD1.5 工作流程,尽管它通常在 SDXL 工作流程中的 Anyline+MistoLine 设置中表现更好。

2024-05-23 20:08:13 401

原创 重磅!腾讯开源混元文生图大模型,与Sora同架构,中英文原生DiT,可免费商用!

我们提出了Hunyuan-DiT,一种文本到图像的扩散转换器,可以对英语和中文进行细粒度的理解。为了构建Hunyuan-DiT,我们精心设计了变压器结构、文本编码器和位置编码。我们还从头开始构建整个数据管道来更新和评估数据以进行迭代模型优化。为了细粒度的语言理解,我们训练了多模态大语言模型来细化图像的标题。最后,Hunyuan-DiT可以与用户进行多轮多模态对话,根据上下文生成和细化图像。

2024-05-22 22:19:21 364

原创 Google发布的CAT3D,在1分钟内,能够从任意数量的真实或生成的图像创建3D场景。

3D重建的进步使高质量的3D捕获成为可能,但需要用户收集数百到数千张图像来创建3D场景。我们提出了cat3d,这是一种通过多视图扩散模型模拟真实世界的捕获过程来创建任何3D内容的方法。给定任意数量的输入图像和一组目标新颖视点,我们的模型生成高度一致的场景新颖视点。这些生成的视图可以用作鲁棒的3D重建技术的输入,以产生可以从任何视点实时呈现的3D表示。CAT3D可以在短短一分钟内创建整个3D场景,并且优于现有的单图像和少视图3D场景创建方法。

2024-05-22 22:14:17 1460

原创 MaxKB,基于 LLM 大语言模型的知识库问答系统,开箱即用,支持快速嵌入到第三方业务系统。

MaxKB 是一款基于 LLM 大语言模型的知识库问答系统。MaxKB = Max Knowledge Base,旨在成为企业的最强大脑。开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化、RAG(检索增强生成),智能问答交互体验好;无缝嵌入:支持零编码快速嵌入到第三方业务系统;

2024-05-21 22:44:12 185

原创 阿里云大幅降价通义千问主力大模型API,降幅高达97%,大大降低了企业使用AI的成本。这一举措使得1元即可处理300万字,将极大推动AI应用的普及和发展。

这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400,击穿全球底价。一般我们开发一个RAG应用,或者进行长文本分析,都需要喂大模型一堆私有的数据(比如网友上搜索出来的信息、PDF文档等),给大模型输入的数据会比输出数据大很多倍,因此输入价格的降低幅度越高,我们能省的就越多!阿里通义千问主力模型Qwen-Long将千tokens的输入价格降到了0.0005元/千tokens(原来是0.02元/千tokens,等于直降了97%),相当于1块钱可以买200万tokens。

2024-05-21 22:41:09 327

原创 北航提出part2whole:可控⼈体图像⽣成的统⼀参考框架,可从任何数量和不同来源的参考人体部位图像中生成逼真的、高质量的各种姿势的人体人物图。

最近在可控人类图像生成方面的进展导致了使用结构信号(例如,姿势,深度)或面部外观的零拍摄生成。然而,以人类外表的多个部分为条件生成人类图像仍然具有挑战性为了解决这个问题,我们介绍了Parts2Whole,这是一个新的框架,用于从多个参考图像(包括姿势图像和人体外观的各个方面)生成定制肖像。为了实现这一点,我们首先开发了一个语义感知的外观编码器,以保留不同人体部位的细节。将一个基于文本标签将每张图像处理成一系列多尺度特征图,而不是一个图像标记,以保持图像的维度。

2024-05-20 21:10:49 658

原创 超越IP-Adapter!字节提出MoMA,一种即插即用、无需调优的快速个性化生成方法!

在本文中,我们提出了MoMA:一个开放词汇,无需训练的个性化图像模型,具有灵活的零拍摄功能。随着基础文本到图像模型的快速发展,对稳健的图像到图像翻译的需求也在增长。为了满足这一需求,moma专注于主题驱动的个性化图像生成。利用开源的多模态大型语言模型(MLLM),我们训练MoMAto作为特征提取器和生成器的双重角色。该方法有效地将参考图像和文本提示信息协同产生有价值的图像特征,促进了图像扩散模型。

2024-05-20 21:07:24 680

原创 当前最好的Stable Diffusion角色特征固定工具来了!字节提出PuLID,用于文本生成图像领域,实现了高度的ID保真度与可编辑性。

我们提出了一种新的无需调优的文本到图像生成ID自定义方法PuLID (Pure and Lightning ID customization)。通过将一个标准扩散分支与一个LightningT2I分支结合起来,PuLID引入了对比对准损耗和精确ID损耗,最大限度地减少了对原始模型的干扰,并确保了高ID保真度。实验表明,PuLID在ID保真度和可编辑性方面都取得了较好的性能。PuLID的另一个吸引人的特性是,插入ID前后的图像元素(例如背景、光照、构图和样式)尽可能保持一致。

2024-05-16 22:49:59 344

原创 字节提出ControlNet++:更强更可控的图像生成框架!通过高效的一致性反馈改进条件控制!

为了增强文本对图像扩散模型的可控性,现有的方法有如ControlNet Incorporated基于图像的条件来进行控制。在本文中,我们揭示了现有方法在生成与图像条件控件保持一致的图像时仍面临重大挑战。为此,我们提出了ControlNet ++,这是一种新颖的方法,可以通过明确优化生成的图像和条件控制之间的像素级循环一致性来改善可控生成。具体而言,对于输入条件控制,我们使用预先训练的判别奖励模型来提取生成的图像的相应条件,然后优化输入条件控制和提取条件之间的一致性损失。

2024-05-16 22:46:25 714

原创 字节和旷视提出HiDiffusion,无需训练,只需要一行代码就可以提高 SD 生成图像的清晰度和生成速度。代码已开源。

扩散模型已成为高分辨率图像合成的主流方法。但是直接从预处理的扩散模型中生成高解决图像将遇到不合理的对象重复,并指数增加生成时间。在本文中,我们发现对象重复是由U-NET深块的特征重复引起的。同时,我们将延长的生成时间指定为U-NET的顶部块中的自我发挥冗余。为了解决这些问题,我们提出了一个名为Hidiffusion的无调高分辨率框架。

2024-05-15 23:15:15 548

原创 谷歌2024 I/O 开发者大会回顾:足足喊了120次AI 实时交互、视频模型登场

从北京时间5月15日周三凌晨1点开始,谷歌在山景城总部附近的海岸线圆形剧场,召开了长达两个小时的年度I/O开发者大会Keynote演讲。简短总结一下Google 2024 I/O 大会内容,主要分为两个部分:第一部分侧重于模型层面的内容,几乎覆盖了目前所有的生成模型类型。第二部分,主要是产品层面的内容,如谷歌搜索,谷歌文档,谷歌表格等。刚兴趣的小伙伴可以观看下面的回放链接,来看看Google有什么大招,是否被OpenAI狙击?

2024-05-15 23:13:54 925

原创 Lumina-T2X 一个使用 DiT 架构的内容生成模型,可通过文本生成图像、视频、多视角 3D 对象和音频剪辑。

Sora揭示了缩放扩散变压器(DIT)的潜力 以任意分辨率,宽高比和持续时间为单位的影像图像和视频,但仍然缺乏足够的实施细节。在这份技术报告中,我们介绍了Lumina-T2X家族 - 一系列配备零定位注意的基于流动的大扩散变压器(FLAG-DIT),作为一个统一的框架,旨在将噪声转换为图像,视频,多视图 3D对象和音频剪辑以文本说明为条件。

2024-05-14 19:22:22 945 1

原创 牛津大学和上海交大将SAM和Flow应用于移动目标,简单而有效,轻松分割运动目标.

本文的目标是运动分割——发现和分割视频中的运动物体。这是一个被广泛研究的领域,有许多谨慎的,有时甚至是复杂的方法和训练方案,包括:自监督学习,从合成数据集学习,以对象为中心的表示,模态表示等等。我们在本文中感兴趣的是确定分段任意模型(SAM)是否可以为这项任务做出贡献。我们研究了两种将SAM与光流相结合的模型,利用了SAM的分割能力和光流发现和分组运动物体的能力。

2024-05-14 19:17:55 868

原创 腾讯提出InstantMesh:超快速的图像转 3D且质量很高,30秒内免费从一张图片生成3D模型

我们提出InstantMesh,这是一个从单个图像中立即生成的即时3D网格生成的前馈框架,具有最先进的一代质量和明显的训练可伸缩性。通过协同基于LRM体系结构的现成多视频扩散模型的优势和稀疏视图重建模型,InstantMesh能够在10秒内创建不同的3D资产。为了提高训练效率并利用更多的几何监督,例如深度和正常状态,我们将一个可区分的ISO地表提取模块集成到我们的框架中,并直接在网格表示方面进行优化。公共数据集的实验结果表明,即时插入率明显优于其他最新的图像-TO3D基准,无论是定性和定量上。

2024-05-12 21:43:24 912 2

原创 牛津大学和上海交大将SAM和Flow应用于移动目标,简单而有效,轻松分割运动目标!

本文的目标是运动分割——发现和分割视频中的运动物体。这是一个被广泛研究的领域,有许多谨慎的,有时甚至是复杂的方法和训练方案,包括:自监督学习,从合成数据集学习,以对象为中心的表示,模态表示等等。我们在本文中感兴趣的是确定分段任意模型(SAM)是否可以为这项任务做出贡献。我们研究了两种将SAM与光流相结合的模型,利用了SAM的分割能力和光流发现和分组运动物体的能力。首先,我们对SAM进行调整,使其将流(而不是RGB)作为输入。在第二个模型中,SAM以RGB作为输入,flow作为分割提示符。

2024-05-12 21:41:22 564

原创 谷歌推出10门免费AI课程,无需教科书及费用

谷歌面向小白以及开发者分别推出了不同的AI课程~ 包含初级、中级和高级。课程章节大致包括:(含教学视频、参考材料、测验)基础入门:45分钟深入了解生成式AI简单实操:30分钟掌握大语言模型了解如何释放生成式 AI Studio 的强大功能深入研究图像生成模型使用Codey在短短60秒内像专业人士一样编码探索将AI融入产品。

2024-05-07 20:16:09 321

原创 字节和旷视提出HiDiffusion,无需训练,只需要一行代码就可以提高 SD 生成图像的清晰度和生成速度。代码已开源。

扩散模型已成为高分辨率图像合成的主流方法。但是直接从预处理的扩散模型中生成高解决图像将遇到不合理的对象重复,并指数增加生成时间。在本文中,我们发现对象重复是由U-NET深块的特征重复引起的。同时,我们将延长的生成时间指定为U-NET的顶部块中的自我发挥冗余。为了解决这些问题,我们提出了一个名为Hidiffusion的无调高分辨率框架。

2024-05-07 20:14:23 717 5

原创 腾讯的Sora来了!腾讯PCG ARC实验室推出Mira(Mini-Sora):迈向Sora长视频生成的一小步

Mira (Mini-Sora),这是对 Sora 风格的高质量、长时间视频生成领域的初步尝试。Mira 在几个关键方面从现有的文本到视频 (T2V) 生成框架中脱颖而出:扩展序列长度:虽然大多数框架仅限于生成短视频(2 秒/16 帧),但 Mira 的设计目的是生成更长的视频序列,可能持续 10 秒、20 秒或更长时间。增强动态:Mira 能够创建具有丰富动态和复杂动作的视频,使其有别于当前视频生成技术的静态输出。

2024-04-18 09:11:02 644

原创 北大&字节联合发布视觉自动回归建模(VAR):通过下一代预测生成可扩展的图像

视觉自回归建模(VAR)是一种新的视觉生成范式,它将图像的自回归学习重新定义为从粗到细的“下一个尺度预测”或“下一个分辨率预测”,与标准光栅扫描“下一个令牌”不同预言”。这种简单、直观的方法允许自回归(AR)转换器快速学习视觉分布并很好地概括。

2024-04-18 09:08:07 648

原创 硬刚Suno?StabilityAI推出Stable Audio 2.0,可生成三分钟44.1kHz立体声的高质量完整曲目

Stable Audio 2.0潜在扩散模型的架构经过专门设计,能够生成具有连贯结构的完整音轨。为了实现这一目标,我们对系统的所有组件进行了调整,以提高长期的性能。一种新的高度压缩的自动编码器将原始音频波形压缩为更短的表示形式。对于扩散模型,我们采用类似于stable diffusion 3中使用的扩散变压器 (DiT)来代替之前的U-Net,因为它更擅长处理长序列上的数据。这两个元素的结合产生了一个能够识别和再现高质量音乐作品所必需的大规模结构的模型。自动编码器压缩音频并将其重建回原始状态。

2024-04-17 21:31:02 420

原创 斯坦福发布端侧AI模型Octopus V2:推理比GPT-4快168%,准确率超Llama7B

为了更好地适应移动设备的需求,研究团队专为Android系统打造了Octopus-V2-2B版本,力求在Android设备上实现无缝对接,应用场景涵盖了从系统管理到多设备协同工作的广泛领域。Octopus-V2-2B展现出了在复杂场景下生成独立、嵌套和并行函数调用的能力,充分体现了模型的高度灵活性和实用性。在模型训练与数据集构建方面,Octopus-V2-2B独树一帜地引入了功能Token策略,并将其贯穿于训练和推理全过程。

2024-04-17 21:29:00 857

原创 腾讯&清华联合提出图像到视频生成方法-Follow-Your-Click:点击图像并加上简单提示词就可让图像动起来!

尽管最近在图像到视频生成方面取得了进展,但更好的可控性和局部动画却很少被探索。大多数现有的图像到视频的方法不具有局部意识,并且倾向于移动整个场景。然而,人类艺术家可能需要控制运动不同物体或区域的。此外,当前的I2V方法需要 用户不仅要描述目标运动,还要提供冗余的帧内容详细描述。这两个问题阻碍了当前I2V工具的实际应用。在本文中,我们提出了一个实用的框架Follow-Your-Click,通过简单的用户点击(用于指定要移动的内容)和一个简短的按钮来实现图像动画运动提示符(用于指定如何移动)。

2024-04-16 22:47:39 701

原创 福布斯发布2024年人工智能初创企业50强

随着人工智能热潮的持续,一种新的技术经济正在帮助企业开发和部署人工智能驱动的应用程序。在《福布斯》第六届年度“人工智能50强”榜单上,这类新锐企业正大行其道。该榜单遴选了AI领域最有前途的初创公司,由《福布斯》在领先行业专家的帮助下,与数据合作伙伴红杉资本和Meritech Capital共同编制而成。

2024-04-16 22:42:07 647

原创 T-GATE:交叉注意力使文本到图像扩散模型中的推理变得麻烦

交叉注意力在文本到图像扩散模型中的作用在文本到图像的扩散模型中,交叉注意力是一个关键组件,它在模型的初期推理步骤中发挥着重要作用。然而,研究表明,交叉注意力的输出在经过几个推理步骤后会收敛到一个固定点,这一点自然地将整个推理过程分为两个阶段:语义规划阶段和保真度提高阶段。在语义规划阶段,模型依赖交叉注意力来规划以文本为导向的视觉语义;在保真度提高阶段,模型则尝试根据先前规划的语义生成图像。令人惊讶的是,在保真度提高阶段忽略文本条件不仅可以降低计算复杂性,而且还能保持模型性能。

2024-04-08 19:36:45 580

原创 微信&中山大学提出SingDiffusion: 可无缝应用到SD和ControlNet中,SD1.5图像生成质量提升33%

大多数扩散模型假设逆过程遵循高斯分布。然而,这种近似尚未经过严格验证,尤其是在t=0和t=1的奇点处。不正确地处理此类奇点会导致应用中的平均亮度问题,并限制极端亮度或黑暗图像的生成。我们主要致力于从理论和实践的角度解决奇点。最初,我们建立逆过程近似的误差界限,并展示其在奇点时间步长的高斯特性。基于这一理论见解,我们确认t=1处的奇点是有条件可去除的,而t=0处的奇点是固有属性。

2024-04-08 19:34:19 346

原创 (CVPR2024)DragGAN作者新作DiffMorpher:可以实现两张图像间的平滑变形

扩散模型取得了超越以前的生成模型的卓越图像生成质量。然而与GAN相比,扩散模型的一个显着局限性是由于其高度非结构化的潜在空间,它们难以在两个图像样本之间平滑插值。这种平滑的插值很有趣,因为它自然可以作为许多应用程序的图像变形任务的解决方案。在这项工作中,我们提出了DiffMorpher,这是第一种使用扩散模型实现平滑、自然图像插值的方法。关键思想是通过分别拟合两个LoRA来捕获两个图像的语义,并在LoRA参数和潜在噪声之间进行插值,以确保平滑的语义转换,其中对应关系会自动出现,无需注释。

2024-04-04 23:13:55 1108

原创 InstantID作者的风格保持新项目InstantStyle发布,一个强化版的IPapadter来了!

基于调整自由扩散的模型在图像个性化和定制领域显示出巨大的潜力。然而,尽管取得了显著进展,目前的模式仍在继续努力应对制作风格一致性的几个复杂挑战图像生成。首先,“风格”的概念本质上是不确定的,包含了多种元素,如颜色、材料、氛围、设计和结构等。其次,基于反演的方法容易出现风格退化,往往导致损失细粒度细节。最后,基于适配器的方法经常需要对每个参考图像进行细致的权重调整,以实现风格强度和文本可控性之间的平衡。在本文中,我们从研究几个引人注目但经常被忽视的问题开始观察。

2024-04-04 23:11:37 525

原创 TextCraftor:一种创新的文本编码器微调技术,无需额外数据集改善图像质量与文本对齐

基于扩散的文本到图像生成模型,例如Stable Diffusion已经彻底改变了内容生成领域。尽管他们在图像编辑和视频合成有很强大的能力,但是这些模型并非没有其局限性。合成一个与输入文本对齐良好的图像仍然是一个挑战,需要详细的提示并多次运行精心制作才能获得满意的结果。为了减轻这些限制,许多研究都在努力利用各种技术微调预训练的扩散模型即UNet。然而,文本到图像扩散模型训练的关键问题一直存在大部分仍未开发。是否可能和可行微调文本编码器来提高文本到图像扩散模型的性能?

2024-04-03 17:06:31 915

原创 继阿里EMO后,腾讯也提出了AniPortrait:用于生成由音频和参考肖像图像驱动的高质量动画

这项研究提出了一个新的框架:AniPortrait。生成由音频和参考肖像图像驱动的高质量动画。方法分为两个阶段。最初,我们从音频中提取 3D 中间表示并将其投影到一系列 2D 面部标志中。随后,我们采用鲁棒的扩散模型,结合运动模块,将地标序列转换为逼真且时间一致的肖像动画。实验结果证明了AniPortrait在面部自然度、姿势多样性和视觉质量方面的优越性,从而提供了增强的感知体验。此外,我们的方法在灵活性和可控性方面表现出巨大的潜力,可以有效地应用于面部运动编辑或面部重演等领域。

2024-04-03 17:04:42 487

原创 音乐界的ChatGPT来了,Suno V3可以在几秒钟内创建两分钟的完整歌曲,所有用户都可以使用!

Suno v3是第一款能够产生广播质量的音乐。V3可以在几秒钟内创建两分钟的完整歌曲,现在所有用户都可以使用v3来做属于你自己的歌!

2024-03-31 20:29:56 355

原创 FlashFace:一种高保真身份保存的人类形象个性化方法

FlsahFace这是一个实用的工具,用户可以通过提供一个或几个参考面图像和一个文本提示,轻易地将自己的照片个性化。我们的方法不同于人类现有的照片定制方法,从高忠诚身份保存和更好的指导从两个微妙的设计中获益。首先,我们将面孔标识编码成一系列特征映射,而不是像以前的艺术中那样使用一个图像标记,这样模型就可以保留更多的参考面孔细节(例如疤痕,纹身,面部形状)。

2024-03-31 20:26:39 465

原创 Databricks开源1320亿参数规模的混合专家大语言模型DBRX-16×12B,评测表现超过Mixtral-8×7B-MoE,免费商用授权!

Databricks作为数据管理领域的超级独角兽,为了抓住生成式AI的风口,2023年6月26日曾以13亿美元的天价,收购了大模型开源平台MosaicML。MosaicML曾在2023年5月5日发布了类ChatGPT开源大语言模型MPT-7B。(开源地址:https://huggingface.co/mosaicml/mpt-7b)该项目具备可商业化、高性能、算力消耗低、1T训练数据等技术优势。MPT-7B只进行了大约10天的训练,零人工干预,训练成本仅用了20万美元。

2024-03-29 22:15:57 531

原创 小米发布SDXS,大幅增强SD图像生成速度,单个GPU实现SD1.5每秒钟100张图,SDXL每秒30张图

最近小米也发布了一个大幅增强SD图片生成速度的项目SDXS,可以在单个GPU 上实现SD1.5每秒100张图的生成速度,SDXL每秒30张图。

2024-03-29 22:14:17 968

原创 阿里推出Wear-Any-Way:可控虚拟试衣最新方案,支持一键自由定制试穿,穿着方式由你定!

本文介绍了一种新颖的虚拟试穿框架,称为“Wear-Any-Way”。与以往的方法不同,Wear-Any-Way 是一种可定制的解决方案。除了生成高保真结果外,我们的方法还支持用户精确操纵试穿风格。为了实现这一目标,我们首先构建了强大的标准虚拟试穿管道,支持复杂场景下的单件/多件试穿以及模特到模特的设置。为了使其可操作,我们提出稀疏对应对齐,其中涉及基于点的控制来指导特定位置的生成。通过这种设计,Wear-Any-Way在标准设置下获得了最先进的性能,并为定制佩戴风格提供了新颖的交互形式。

2024-03-23 23:09:57 1029

原创 最新消息!Stable Diffusion核心研究团队已集体辞职!Stable Diffusion 3后可能再无开源

最新消息,Stable Diffusion核心研究团队已集体辞职!名单包括研究团队领导、论文一作Robin Rombach,共同一作Andreas Blattmann,以及另一位作者Dominik Lorenz合作开发了图像生成模型Stable Diffusion。

2024-03-23 22:59:06 729

java作业管理系统设计(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

javaC语言试题生成与考试系统(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA在线考试管理系统(源代码+论文+开题报告+外文翻译+英文文献+答辩PPT).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

java银行帐目管理系统(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

Java游戏设计打飞机程序(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA语言考试系统的设计与实现(论文+源代码+文献综述+外文翻译+开题报告).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA医药管理系统设计(论文+源代码).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

java一个简单的即时通讯工具的设计与开发(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA音像店租赁管理系统的设计与实现(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA五子棋手机网络对战游戏的设计与实现(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA小区物业管理系统(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA物业管理系统设计与实现(论文+源代码).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA文件传输(论文+源代码).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA网上拍卖系统的设计与实现(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

java图形图象处理(论文+系统).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA网络通信系统的研究与开发(论文+源代码+开题报告).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA网络通信系统的研究与开发(源代码+论文+开题报告).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA图书馆书库管理系统设计(论文+源代码).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

java图书管理系统毕业设计(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA贪吃蛇游戏毕业设计(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

javaWeb物资管理系统项目源码.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVAWEB校园订餐系统项目源码.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

javaweb物流配货项目源码.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

javaWeb传智播客网上书城项目源码(设计以及实现论文).exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

java源码 仿360buy京东商城源码 京东JavaWeb项目源代码.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

Javaweb仓库管理系统项目源码.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

讯友网络相册.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

新奥家电连锁网络系统.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

芝麻开门博客网.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

明日知道.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

科帮网javaWeb计算机配件报价系统项目源码.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

科研成果申报管理系统源码.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

高校学生选课系统项目源码.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

进销存管理系统.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

华奥汽车销售集团网源码.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

编程爱好者博客地带.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

都市供求信息网.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

大学生求职就业网.exe

直接解压exe文件就可以获取资源,资源包含可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVAWML信息查询与后端信息发布系统实现——WML信息查询设计(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

JAVA文件压缩与解压缩实践(源代码+论文).exe

直接解压exe文件就可以获取资源,资源包含毕业论文+可执行文件+源代码+程序使用说明,所有项目代码均已严格验证,可直接运行!如果有什么问题欢迎随时留言。

2024-03-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除