自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(143)
  • 收藏
  • 关注

原创 能够复制声音的 AI

这篇文章主要探讨了实时语音克隆技术在动漫产业中的应用潜力。作者首先介绍了该技术的基本原理,即通过分析五秒钟的语音样本,AI模型可以复制目标人物的声音。然而,作者也指出该技术目前还无法完全还原人类语音中的语气和语调,因为缺乏足够高质量的数据集训练。为了测试该技术的效果,作者尝试将它应用于日语配音的动漫作品中,并尝试使用英语单词拼凑日语发音。虽然结果尚不完美,但作者认为该技术具有巨大的潜力,未来有望...

2024-08-14 04:43:53 193

原创 将漫画上色的人工智能 [Style2Paint]

这个视频介绍了一个名为“Style to Pain”的AI工具,它可以将黑白漫画图像自动上色。该工具可以根据用户选择的颜色类型或参考图像模仿颜色风格。即使用户对某些颜色不满意,也可以通过手动调整颜色来改变AI的自动上色结果。视频以《鬼灭之刃》漫画为例,展示了该工具将漫画图像自动上色的效果。虽然初始效果可能并不完美,但通过调整颜色后,图像变得更加酷炫和视觉震撼。视频最后还提到了《一拳超人》漫画的...

2024-08-14 04:43:22 146

原创 真人版太糟糕了,所以人工智能把它变成了动画。

这段文字主要探讨了将现实场景转化为动漫风格的AI技术,并以卡通GAN(Generative Adversarial Network,生成对抗网络)为例进行了说明。作者首先解释了卡通GAN的工作原理,包括使用随机生成的输入和训练数据来训练AI,以及利用编码器和解码器来学习不同的动漫风格。接着,作者以动漫作品《ゆるキャン△》为例,展示了将现实场景转化为动漫风格的效果。虽然结果并非完美,但作者认为通过...

2024-08-14 04:42:51 210

原创 现实到动漫,卡通化 AI

Y-Box Cartoonization: 新一代动漫风格转换AI这篇文章介绍了一种名为Y-Box Cartoonization的全新AI,它能够将真实影像转化为动漫风格。与之前的Cartoon Gettin相比,Y-Box Cartoonization在分辨率、细节处理和抗锯齿方面表现更加出色。文章作者首先对比了两种AI的优劣:Cartoon Gettin虽然早于Y-Box Cartooni...

2024-08-14 04:42:20 232

原创 AI 生成的歌曲听起来怎么样?[OpenAI Jukebox]

Jukebox:开创音乐生成的新纪元Jukebox是由OpenAI于2020年4月30日发布的音乐生成模型,它能够根据艺术家和流派生成音乐,从嘻哈到乡村音乐无所不包。Jukebox最令人惊叹之处在于它能够学习艺术家的风格和唱腔,这在之前从未如此出色地实现过。它使用三种独立的VQVAE和稀疏Transformer模型来实现这一点。VQVAE是一种自动编码器,它接收原始音频并将其重建。每个层级都...

2024-08-14 04:41:49 165

原创 AI 让任何图像变得电影化 [3D 照片修复]

3D 照片和绘画:将二维图像变为三维的AI技术本文介绍了一种名为“3D 照片和绘画”的AI技术,它利用深度感知和边缘检测将图像转化为3D效果。该技术不仅适用于真实照片,也适用于包含深度感的插画。技术细节:该AI包含两个主要部分:边缘连接(edge connect)用于边缘检测,图像内绘画(image in painting)用于生成图像中原本不存在的部分。由于该AI主要针对真实图像训练,...

2024-08-14 04:41:17 146

原创 AI 生成动漫脸,而且越来越好 [StyleGAN2]

StyleGAN 2:创造逼真动漫脸的利器本文主要介绍了StyleGAN 2在生成动漫脸方面取得的突破性进展。StyleGAN 2 是一款由Nvidia Labs开发的AI模型,能够生成高质量、逼真的不存在的人物脸部图像。与之前的StyleGAN相比,StyleGAN 2修复了大部分问题,生成的人物脸部更加自然,细节更加丰富。Gorn 利用StyleGAN 2创建了 waifu-does-n...

2024-08-14 04:40:47 194

原创 梗背后的技术:Dame Da Ne AI - 单张图像深度伪造

一键生成动画:AI让动漫和电影制作更轻松本文介绍了一种名为“First Order Motion Model for Image Animation”的AI技术,它能够仅用一张图片和一段视频作为输入,就能生成逼真的动画效果。这项技术的优势在于:简单易用: 仅需一张图片和一段视频,就能生成动画,无需大量素材。高效便捷: 比Deepfakes更快速,且能处理更复杂的动作,例如奔跑的马匹。效...

2024-08-14 04:40:16 213

原创 AI 生成新的图像光源 [PaintingLight]

AI 绘画光源:效率与局限本文介绍了一款名为“Painting Light”的AI绘画工具,它能够快速、高效地为图像添加逼真的光源效果。该AI不同于其他基于深度学习的工具,它通过算法估算图像的笔触密度来预测光源效果,从而实现快速的光源模拟。优势:高效: 与人工绘制光源相比,该AI能够在6秒内完成相同效果,大幅节省时间。逼真: AI能够根据笔触密度预测光源,并调整阴影和亮度区域的颜色,...

2024-08-14 04:39:45 198

原创 像素化毁灭战士?现实中的蒙娜丽莎?“放大”AI:PULSE

Paul's AI: 用 Stalgan 实现图像增强和生成本文介绍了一种名为 Paul's 的 AI,它利用 Stalgan 技术进行图像增强和生成。Paul's 能够通过对图像进行降采样,并使用 Stalgan 生成相似的降采样图像,然后通过比较不断调整,最终实现对原始图像的增强或生成。Paul's AI 的主要特点:基于 Stalgan 技术: 利用 Stalgan 的相位生成能力来...

2024-08-14 04:39:14 216

原创 图像补全 AI - 像文本预测一样预测像素 [Image-GPT]

OpenAI 的图像预测模型:用文字预测的逻辑生成图像这篇文章介绍了 OpenAI 在图像生成领域的新突破,他们利用类似于 GPT3 的语言模型,将预测文本的逻辑应用到图像生成上。核心思想: 就像预测文本一样,该模型通过分析已有像素信息,预测下一个像素,并以此逐步生成完整的图像。目前该模型仅支持 32x32 的图像尺寸,但已展现出令人惊叹的能力。应用场景:自然景观生成: 模型能够根据已有...

2024-08-14 04:38:43 178

原创 AI 从 2D 图像生成 3D 人体模型 [PIFuHD - FacebookAI]

Pifu:将2D图像自动转换为3D模型的AI工具本文介绍了由Facebook Research发布的AI工具Pifu,该工具可以将2D图像中的真人图像自动转换为3D模型。Pifu的优势在于:简便快捷: 与传统建模相比,Pifu可以快速将2D图像转化为3D模型,节省大量时间。高质量输出: Pifu能够生成高质量的3D模型,包括衣服、面部细节和背部细节,并输出.obj文件,方便导入其他软件使用...

2024-08-14 04:38:12 230

原创 AI 辅助蒙版 - 立即节省宝贵时间 [AE Rotobrush 2]

After Effects Roto Brush 2:AI加持,告别繁琐抠图!这篇文章主要介绍了 Adobe After Effects 推出的新版抠图工具 Roto Brush 2,并着重强调了其利用 AI 技术带来的效率提升。作者以舞蹈视频为例,说明了传统的抠图工作量巨大,尤其是对于肢体动作频繁的场景,手动抠图可能需要数小时甚至更长时间。然而,Roto Brush 2 的出现彻底改变了这一...

2024-08-14 04:37:42 110

原创 这款 AI 可以仅凭图像重建真实物体 [NeRF]

NeRF:用AI重建场景,生成全新视角NeRF(神经辐射场)是一种利用AI技术重建场景并渲染全新视角的工具。它与传统的3D绘画不同,不仅接收图像作为输入,还考虑图像角度、物体距离和视角位置等信息。这些信息并非人工输入,而是由AI从输入的图像中提取。NeRF 通过分析多张不同视角的图像,生成一个新的视角,并估计场景在该视角下的样子。然而,它需要大量图像来构建场景,这与3D绘画类似,且耗时较长。因...

2024-08-14 04:37:11 127

原创 图像修复AI - 使用DFDNet放大和修复人脸

DFTNet: 利用多尺度组件字典进行盲相位恢复,实现高质量图像修复本文介绍了一种名为DFTNet的AI技术,它利用多尺度组件字典进行盲相位恢复,能够有效修复受损图像,尤其是人脸图像。与传统的图像超分辨率技术相比,DFTNet能够更好地处理细节信息,例如人眼、嘴巴和牙齿等特征,并根据低分辨率图像推测出高分辨率图像的细节。DFTNet采用了一种名为“参考式人脸修复”的技术,它将图像分割成不同的区...

2024-08-14 04:36:40 159

原创 2020最佳图像着色AI

本文介绍了10款AI图像着色工具,并对它们进行了测试和评价。作者认为,将黑白照片着色可以让人重温历史时刻,但手动着色耗时费力,因此AI着色工具成为了很好的替代方案。作者测试了10款AI工具,并根据其表现将其分为三个类别:最佳免费着色工具、最佳付费着色工具和总体最佳工具。测试标准是所有工具必须成功着色三张测试图片,否则会被视为失败。作者选择了三张测试图片:一张玛丽莲·梦露的近照,一张马丁·路德·...

2024-08-14 04:36:09 170

原创 图像分解 AI - 轻松编辑高光和纹理 [外观擦除器]

AI 简化图像处理:自动消除外观保留与优化平滑本文介绍了一种新的 AI 技术,可以自动完成图像平滑处理,无需人工干预,并由此衍生出各种图像处理功能,包括增强、分解、纹理替换、重新照明、重新着色和风格化。传统方法的局限性: 传统的图像平滑技术需要人工手动标记图像中的纹理和高光区域,这一过程耗时且需要专业知识。AI 的突破: 这项新的 AI 技术通过观察人工标记的模式,自行识别需要标记的像素,...

2024-08-14 04:35:38 177

原创 仅音频的深度伪造 [Wav2Lip]

这段文字主要介绍了一种名为“Wave2Lip”的人工智能技术,它可以将音频与视频中的嘴唇动作进行同步,实现唇形同步。该技术的主要特点:利用音频而不是另一张脸来生成嘴唇动作,与其他类似技术(如DFAKE)不同。可以将音频与任何视频同步,实现配音或语言转换。还可以用于动画角色的唇形同步,以及生成诡异的视频通话效果。具有很大的娱乐潜力,可以用于制作表情包等。该技术的应用场景:将外语演...

2024-08-14 04:35:07 162

原创 复制现实,粘贴到你的电脑 [AR 剪切和粘贴]

“魔法”复制粘贴AI:原理、优势与局限这篇文章介绍了一种名为“魔法”复制粘贴AI的程序,它将图像识别AI(U-squared net)与基于OpenCV的屏幕点算法相结合,实现将手机摄像头拍摄到的物体“复制粘贴”到电脑屏幕上的功能。程序原理:U-squared net: 一种基于深度学习的图像识别AI,能够识别图像中的重要物体并生成其掩模。它采用嵌套U结构,在物体识别方面表现出色,在基准...

2024-08-14 04:34:36 153

原创 这款 AI 将面孔转换为超逼真的卡通角色 [Toonify]

这篇文章介绍了一种名为Tunify的AI模型,它能够生成逼真的卡通人脸。文章首先介绍了StyleGAN2,一种由Nvidia开发的知名人脸生成模型。然后,文章探讨了如何通过微调StyleGAN2模型的隐藏层,将它改造为生成更不真实的图像,例如卡通人脸。文章指出,直接用卡通图像训练StyleGAN2会导致背景和皮肤细节出现问题。为了解决这个问题,作者使用了Justin Pinkney提出的层交换...

2024-08-14 04:34:06 211

原创 这款 AI 可自动修复受损的老照片!

Bring Old Photos Back to Life: 微软开源AI修复老照片的测评本文介绍了微软最新发布的开源AI修复老照片工具“Bring Old Photos Back to Life”,并对其功能和效果进行了详细测评。该AI拥有多种修复功能,包括降噪、色调调整、锐化以及最令人期待的物理损伤修复。 它可以修复各种物理损伤,包括划痕、食物印记和棕色斑点,效果十分令人印象深刻。测评过...

2024-08-14 04:33:34 198

原创 AI 动画滤镜 - Snapchat 对比 TikTok

Snapchat 和 TikTok 的“现实脸转动漫”滤镜对比:本文主要讨论了 Snapchat 和 TikTok 推出的“现实脸转动漫”滤镜,并将其与此前流行的“selfie to anime”技术进行对比。作者指出,Snapchat 和 TikTok 的滤镜在效果上明显优于“selfie to anime”技术,因为后者往往导致面部比例失衡,而前者则能够更好地保留人脸的特征,并将其转化为动...

2024-08-14 04:33:03 156

原创 AI 减少视频通话带宽问题 [NVIDIA Maxine]

NVIDIA 新AI技术:虚拟会议的未来?这段文字主要介绍了 NVIDIA 最新发布的 AI 技术,并对其进行了深入分析。该技术并非传统的视频压缩方法,而是通过操纵面部关键点,实时生成高分辨率的视频,让人看起来像是在说话。文章首先强调了该技术带来的冲击:价格战: NVIDIA 新 GPU 的价格远低于 RTX 280,功能却保持不变,这将对整个行业造成巨大冲击。AI 发展加速: 新 GP...

2024-08-14 04:32:32 109

原创 AI 动作捕捉 - 无需紧身衣追踪你的手和身体 [FrankMocap]

这段文字主要介绍了Facebook在开源领域做出的贡献,以及一个名为Frank Mocap的单视角3D手部和身体姿态估计AI。Facebook在开源方面的贡献:Facebook在过去几年持续更新其主要开源项目,为其他研究提供了更多开发和修复错误的可能性。Facebook开发了视频深度感知和图像人体估计等AI技术,为未来人类发展提供了更好的工具。Frank Mocap的介绍:Fran...

2024-08-14 04:32:00 97

原创 AI 将卡通人物转化为现实生活 [Pixel2Style2Pixel]

AI 生成图像技术的最新进展:从 Style Gen 2 到 PSP 编码器本文主要介绍了人工智能图像生成技术的最新进展,尤其是基于 Style Gen 2 模型的图像生成技术。Style Gen 2 是一种生成逼真人类面部图像的模型,其成果令人瞩目,但仍存在一些问题:参数控制不精确: Style Gen 2 使用类似“阀门”的参数来控制面部特征,但结果很不稳定,即使微小的参数调整也会导致...

2024-08-14 04:31:29 112

原创 SkyAR 人工智能天空替换

这段文字介绍了一项新的 AI 研究论文,该论文可以生成逼真的增强现实效果,例如将视频中的天空替换成任何你想要的图像。该 AI 能够自动进行运动估计、天空抠图、天空盒创建和重新照明,从而使创建创意作品的速度大大提高。该 AI 能够将天空替换成任何图像,并通过运动跟踪将其固定在背景中,使其看起来像是真实的天空。虽然该 AI 能够在几秒钟内处理大量视频帧,但它目前只针对白天天空进行了训练,因此在处理其...

2024-08-14 04:30:58 182

原创 比DAIN更好?使用AI提升视频FPS的全新最佳工具[RIFE/Flowframes]

使用AI提升视频帧率:Rife 优于 Dane本文主要介绍了利用AI技术提升视频帧率的技术,特别是对比了两种帧插值算法:Dane和Rife。Dane 算法利用视频中的深度信息进行帧插值,但计算时间过长,处理2分钟视频需要10个小时。Rife 算法则采用了一种名为“ifnet”的神经网络,直接估算图像间的中间流,并通过更精确的流和融合过程,实现了更高质量、更快速、更精确的帧插值。Rife 的优...

2024-08-14 04:30:27 349

原创 逐笔作画的AI

这篇文字主要介绍了一种新的AI绘画技术——风格化神经绘画。传统AI绘画技术通常通过操控像素来模仿真实画笔、油画或插画的风格,但很难实现自然逼真的效果。新的AI绘画技术则采用了更直观的思路,类似于人类绘画的方式,即逐笔绘制。该技术名为“风格化神经绘画”,可以生成各种风格的画作,包括油画、马克笔画、像素画和水彩画等。该技术的核心是通过参数搜索来最大化输入图像与AI绘制的画布之间的相似度,从而实现...

2024-08-14 04:29:56 182

原创 当人工智能机器人设计自己时会发生什么?

进化算法的局限性和RoboGrammar的突破本文主要讨论了进化算法(或遗传算法)在解决复杂问题时的局限性,并介绍了RoboGrammar如何通过结合蒙特卡洛树搜索和图启发式搜索来克服这些局限性。进化算法的缺陷:局部最优: 进化算法就像在迷雾中盲目攀登山峰,只能选择眼前最高的山峰,无法突破局部最优,找到真正的最高峰。依赖初始条件: 初始选择的起点会很大程度地影响最终结果,这就像攀登不同...

2024-08-14 04:29:25 357

原创 任何东西都可以是“绿幕”了 [实时高分辨率背景抠像]

背景抠像技术新突破:实时高分辨率背景抠像v2本文介绍了一种名为“背景抠像v2”的实时高分辨率背景抠像技术,它能够在不使用特定背景色(如绿色)的情况下,将视频中的背景与前景分离,实现类似绿幕的效果。主要优势:无需特定背景色: 不再需要使用绿幕或蓝幕,任何背景都可以作为抠像背景。高精度: 即使在4K视频中,也能准确识别头发、发带等细节,生成清晰的Alpha通道。实时处理: 使用RTX 20...

2024-08-14 04:28:53 119

原创 AI 将任何图像转换为素描或线条画 [ArtLine]

AI 艺术线:将图片转换为精细线条艺术的利器本文介绍了一款名为“Art Line”的全新 AI 模型,它能够将图片转化为精细的线条艺术。该模型拥有以下特点:1. 高精度: Art Line 能够将图片中的轮廓、面部特征以及细节转化为清晰的线条,其精度远超市面上其他同类产品。2. 易于使用: 用户只需提供图片链接,点击几个按钮即可轻松运行 AI 模型,生成线条艺术作品。3. 突破性技术: 该...

2024-08-14 04:28:23 231

原创 很快就能取代矢量艺术家的人工智能 [DALL-E]

OpenAI 的 Dao Yi AI 模型:文字生成图像的新突破OpenAI 在 2021 年初推出了全新的 AI 模型 Dao Yi,它可以根据文字描述生成图像。Dao Yi 的名字灵感来源于艺术家萨尔瓦多·达利和皮克斯的《机器人瓦力》。Dao Yi 的成功得益于 GPT-3 语言模型,后者能够通过学习互联网上的海量信息来完成任何文本。Dao Yi 通过关联文字描述中的概念来生成图像,展现了...

2024-08-14 04:27:52 172

原创 Photoshop 检测器 AI 误导性

社交媒体的“真实”与AI识破PS:一个关于美颜和现实的探讨本文探讨了社交媒体上过度美颜带来的负面影响,以及AI技术在识别PS照片方面的应用。社交媒体上的“真实”:社交媒体平台如Instagram,充斥着经过精心修饰的照片,营造出一种虚假的现实感。这种现象对年轻人尤其有害,因为他们会将这些完美的照片作为现实标准,进而产生自卑和焦虑。为了揭露社交媒体上的虚假,一些平台如“r slash I...

2024-08-14 04:27:21 136

原创 在线购物的未来

时尚AI:虚拟试衣的革命传统的网购试衣体验存在着诸多弊端,例如尺寸不合适、风格不满意,需要退换货,整个流程耗时且繁琐。为了解决这个问题,一些人工智能研究人员致力于开发“虚拟试衣”技术。Vogue Virtual Try-On 是一款由Google、MIT AI Lab和UW共同开发的虚拟试衣AI,它基于StyleGAN2图像生成模型,并结合其他算法,能够将衣服以逼真的方式投影到人的身上。该技...

2024-08-14 04:26:50 433

原创 神经风格迁移 - 使用 AI 传输和混合多种风格

这篇文字主要介绍了一种名为“神经风格迁移”的AI技术,它可以将多张图像的风格融合到一张目标图像上,从而创造出独特的美学效果。作者首先解释了神经风格迁移与“深度梦境”技术的不同之处,并强调了神经风格迁移的潜力。接着,作者介绍了该技术的工作原理,并分享了一些个人经验和观察:风格迁移的成功取决于合适的图像组合和参数调整。可以将不同的风格图像应用于目标图像的不同区域,例如用曲线纹理来渲染植物,用几...

2024-08-14 04:26:19 196

原创 视频超分辨率:Topaz Labs 对比最先进技术

视频超分辨率AI工具对比:付费工具Topaz AI表现出色本文作者对比了三种视频超分辨率AI工具:付费工具Topaz AI以及两个开源研究成果IC Better和Tecogen。作者通过将1080p视频降至240p,然后使用三种AI工具进行4倍超分辨率,比较了它们在清晰度、细节生成和图像伪影等方面的表现。结果显示:Topaz AI在清晰度方面表现最佳,虽然存在更多图像伪影,但整体效果更接近...

2024-08-14 04:25:48 211

原创 图像搜索的未来将会是什么样子

CLIP: 用自然语言搜索图片的革命这篇文章主要介绍了OpenAI的CLIP模型,它能用自然语言来搜索图片,改变了传统的关键词搜索模式。**问题:**传统图片搜索依赖关键词,如果描述复杂,很难找到准确的图片。就像你想要找一部电影,只记得情节,却无法通过关键词找到它。**解决方案:**CLIP模型通过学习海量图片和文本数据,可以理解自然语言描述并找到匹配的图片。优势:**减少数据标注成本...

2024-08-14 04:25:17 143

原创 现在每个人都可以轻松制作3D动画![怪兽狂欢]

Monster Mesh: 一款简化3D动画制作的AI工具Monster Mesh 是一款基于AI的工具,旨在简化3D动画制作流程,即使没有3D建模经验也能轻松上手。其核心功能在于将用户绘制的2D草图转化为可动画的3D模型,并提供简单的控制点操控方式,让用户能够像玩木偶一样控制模型的动作。优势:简单易用: 只需绘制草图、膨胀模型并控制关键点即可生成动画,无需复杂的建模、绑定和3D操作。快...

2024-08-14 04:24:46 125

原创 AI 驱动的 3D 视频稳定 [NSFF]

神经场景流场 (NSFF) - 超越神经辐射场 (NERF) 的深度估计新技术本文介绍了一种名为神经场景流场 (NSFF) 的新人工智能技术,它在深度估计方面超越了神经辐射场 (NERF)。NSFF 的核心优势:更准确的深度估计: 与 NERF 相比,NSFF 利用多个图像信息,构建更准确的场景深度信息。更灵活的视角控制: 用户可以控制虚拟相机的位置和运动,实现更稳定的画面,或进行圆周运...

2024-08-14 04:24:15 169

原创 OpenAI 的讽刺聊天机器人 [GPT-3 API 测试版]

GPT-3:强大的语言模型,让AI拥有多种能力GPT-3,全称为“生成式预训练Transformer 3”,是由OpenAI发布的一个强大的语言模型。它被训练了海量数据,包括整个互联网,并拥有大量的参数,这使得它具备了惊人的能力,可以完成各种任务,例如编写代码、翻译语言、设计作品,甚至制作表情包。GPT-3 的核心原理是“少样本学习”,这意味着在评估AI时,需要先提供一些示例,让它学习并模仿你...

2024-08-14 04:23:45 110

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除