千年一瞬,兵马俑竟眨眼了!外国小哥用AI复原了他

来源:新智元
  本文为约1416字,建议阅读3分钟
本文介绍了外国博主借用AI技术让秦代兵马俑「活了过来」

2bc63b43f21ac90fbc72cd72e0923b09.jpeg

千年一瞬,他们眨眼的瞬间,仿佛历史重演。

前不久,外国博主Panagiotis Constantinou用AI修复了秦代兵马俑。

914d84aa7c7735194acac3181630328a.gif

更令人惊艳的是,他还让古人做出了细微的动态表情

快看,兵马俑在向你眨眼、微笑。

去过兵马俑后,大家都会对这些泥塑真人古迹的感到震撼。再看用AI复原后的兵马俑,竟变成了有血有肉的大叔。

ba298aa937f8db47918335be069a03e1.gif

每个兵马俑的表情都是千奇百态,几千年过去了,我们很难想象出他们当时的样子。

这位外国小哥让这些兵俑重新焕发了生机,穿越千年来和你对话。

此前,B站UP主大谷也对兵马俑进行了修复,让其嘴巴也动了起来。

26767051c948698b8e2016a15c44476d.gif

其实,除了兵马俑,Panagiotis Constantinou还对埃及帝王敌后、古希腊哲学家、英国女王等做了一系列动态修复。

接下来一起欣赏下。

穿越时空相逢

古罗马末期声名显赫的首富Marcus Crassus

65afcc781141191a2d09be3c7f4628ca.gif

亚历山大大帝

9bfeba6f118d8ed6975d5bb019776d8c.gif

古埃及艳后

85724ad48144e116091306ed965a45f9.gif

英国女王

7d07bffdc8fc39c40b4d94afa65c0af1.gif

......

凭借这一系列修复,外国博主也爆火出圈,也引来许多人的关注。

9595247009be93724a9d1bbcc9e8c958.png

修复技术


那么AI修复工作一般都是如何实现的呢?

大多都会用到这三个技术:第一个是负责做补帧的DAIN,第二个是做分辨率扩增的ESRGAN,第三个是上色的DeOldify

DAIN:深度感知视频帧插值(DAIN)模型,通过探索深度信息来显式地检测遮挡。该项目开发了一个深度感知流动投影层,优选取样更近的物体,以合成中间流插补视频帧。

c82d2efda0ba6451fb8f7802e7bd72c0.gif

ESRGAN:ESRGAN改进自SRGAN ,主要用来做视频超分辨率。

与SRGAN的深层模型越来越难以训练相反,更深层次的 ESRGAN 模型通过简单的训练就能达到卓越的性能,核心点在于平衡视觉质量和峰值信噪比的网络插值策略

00d22879a749a177da073860182a7f81.jpeg

DeOldify:DeOldify 使用了NoGAN 进行训练,NoGAN对于获得稳定和丰富多彩的图像是至关重要的。

NoGAN 训练结合了 GAN (美妙的着色)的好处,同时消除了副作用(如视频中的闪烁对象)。

不论是图像还是视频,AI能够将其修复得栩栩如生,最主要的是归功于它强大的学习能力。

这里我们再简单了解一下AI修复离不开的「灵魂GAN」。

还记得马和斑马相互转换的图像吗?这便是GAN的应用之一。

29a2d301ecd1d6df819efba8f13eccb8.gif

f608d5f13a8dd7f9ebbbffcc72de716f.png

和其他经典的机器学习算法相比,GAN算法最大的创新点便是它结合了生成器(Generator)和判别器(Discriminator),以二者的相互对抗进而实现相互优化,最后达到一个「势均力敌」的状态。

以图像为例,判别器D经过反复训练,最后希望可以准确分辨出哪一个是真实的数据分布,哪一个是生成器的数据分布;同时,生成器G也不断地训练,最后希望能够以假乱真,让判别器判断不出到底哪个是真的图像,哪个是假的图像。

现在越来越多的技术像是AI修复、AI换脸等都离不开GAN网络,曾经困扰GAN的难题,比如难以收敛等也都渐渐得到了改善,而且基于GAN也衍生出了越来越多的更优秀的网络,比如CycleGAN、StackGAN等,愈加逼真、生动的图像逐一呈现在大众眼前。

现在大抵是「万物皆可AI」的时代了!

AI还会继续给我们带来何种视觉惊喜,我们拭目以待~~~

参考资料:

https://www.youtube.com/watch?v=K1ojdnvOXS0

https://github.com/junyanz/CycleGAN/blob/master/imgs/horse2zebra.gif

推荐阅读

欢迎大家加入DLer-计算机视觉技术交流群!

大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

199257f55202019b891cf9a2a90350d1.jpeg

👆 长按识别,邀请您进群!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Windows 平台上有几款流行的语音智能助手,包括: 1. Microsoft Cortana:这是由微软提供的语音智能助手,它可以帮助用户完成各种任务,如查找信息、设定提醒等。 2. Dragon NaturallySpeaking:这是一款语音识别软件,可以将用户的语音转化为文本,并提供基本的语音控制功能。 3. Amazon Alexa:这是由亚马逊提供的语音智能助手,可以通过智能音箱或手机应用使用。它可以帮助用户获取信息、播放音乐、设定提醒等。 4. Google Assistant:这是由谷歌提供的语音智能助手,可以通过智能音箱或手机应用使用。它可以帮助用户获取信息、控制设备、设定提醒等。 ### 回答2: 以下是几款Windows平台上常见的语音智能助手: 1. Cortana:Cortana是Windows 10操作系统中的内置语音助手。它可以执行各种任务,如发送邮件、设置提醒、搜索互联网等。Cortana还可以集成其他应用程序,并管理用户的日历和待办事项。 2. Alexa for PC:亚马逊的Alexa语音助手已经进入Windows平台。用户可以通过安装Alexa应用程序或购买支持Alexa的设备来使用它。它能够回答问题、播放音乐、控制智能家居设备等。 3. Microsoft Dictate:Microsoft Dictate是一款微软开发的语音识别助手,可以帮助用户通过语音输入进行文字处理。它支持多种语言,包括英语、中文、法语等,并具有实时转写和翻译功能。 4. Dragon NaturallySpeaking:Dragon NaturallySpeaking是一款针对个人和专业用户的语音识别软件。它支持Windows平台,并允许用户使用语音输入文字、操作应用程序和搜索互联网。 5. Braina Pro:Braina Pro是一种多功能语音和人工智能助手,可以在Windows操作系统上运行。它可以帮助用户执行各种任务,如搜索互联网、查找文件、发送邮件、转录音频等。 这些语音智能助手在Windows平台上提供了许多方便的功能,可以帮助用户提高工作和生活效率。 ### 回答3: Windows平台上有几款语音智能助手供用户选择,如Cortana、Siri for Windows和Alexa for PC。 Cortana是由微软公司开发的一款语音智能助手,它为Windows用户提供语音识别、语音搜索、语言翻译、日历提醒等功能。用户可以通过与Cortana说话来让它执行任务,如发送短信、设置闹钟、打开应用程序等。 Siri for Windows是一款由第三方开发的Windows平台语音智能助手,它模仿了苹果公司的Siri的功能。用户可以使用Siri for Windows来发送短信、搜索信息、播放音乐等,只需要通过语音指令即可完成。 Alexa for PC是亚马逊公司开发的一款语音智能助手,它在Windows平台上提供了与Alexa Echo设备类似的功能。用户可以通过与Alexa for PC说话来控制智能家居设备、查询新闻、播放音乐等。 这些语音智能助手都在不同程度上提供了语音交互、智能识别和智能服务的功能,使用户的生活更加便捷。用户可以根据自己的需求和偏好选择适合自己的语音助手来提升工作效率和生活质量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值