何必心中无码，AI让你眼见为实

最新推荐文章于 2024-05-26 11:19:04 发布

AI启蒙研究院

最新推荐文章于 2024-05-26 11:19:04 发布

阅读量4.3k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l70ashc3q50/article/details/80147060

版权

640?wx_fmt=png

还在为珍贵的照片，被路人抢镜而苦恼吗？

还在为景区人山人海，而拍不到一人一景手足无措吗？

上周，英伟达发布了一个超牛逼的AI修图技术，不需要专业的修图师进行修图，能够很完美的解决以上问题。下面我先来一下，官方发布的宣传视频：

一些传统的修图软件，通常采用的是：临近像素填充的方法来进行照片修复的。这种方法，对于一些比较细小的折痕等，可以比较好的进行还原。但是一旦损坏面积稍大，或者关键部位需要还原，这个方法就变得很笨拙。

举个例子：如果一张照片的脸部刚好眼睛位置，那么采用这种方式还原，往往眼睛部位会以皮肤像素填充，就会导致成为“无眼怪人”或者“独眼龙”……

下面我们来看一下，原图被涂抹之后，再还原之后的差异。

人像：

640?wx_fmt=jpeg

动物：

640?wx_fmt=jpeg

景色：

640?wx_fmt=jpeg

可以看到，目前还原的效果已经非常惊艳了。NVIDIA公司已经发布了相关技术论文，那么现在老司机带你一起解读下这篇论文的神奇之处。《Image Inpainting for Irregular Holes Using Partial Convolutions》---NVIDIA Corporation 准备好，一场无码之旅，开始了。

640?wx_fmt=png

论文开头，我们可以看到英伟达研究团队，对目前多种不同的图像修复方法进行了对比。(a)被破坏的图片，(h)原图，(g)本文主要介绍的“部分卷积（partial convolution）”网络修复效果。其他几种方式这里不再提及，有兴趣的同学可以去看下论文原文介绍。

640?wx_fmt=png

部分卷积层表达式：

640?wx_fmt=png

其中：W是卷积滤镜，b是偏差，X是当前卷积层的特征值（像素值），M是个二进制掩码（原图的兴趣区域ROI），被挖去的部分是0否则为1。一个圆圈中间一个点的符号表示对应元素相乘（element-wise），sum(M)为归一化因子。这样就刨除了被挖去的部分的影响，是不是很straightforward，很make sence？

再来研究一下loss函数：

640?wx_fmt=png

总的loss函数分为几个部分，权重作为超参也是经过训练选出来的。其中权重最大的是style-loss，是相关函数的一阶范数，表达式如下。

640?wx_fmt=png

其中Kn是归一化因子。style-loss起到关键作用，决定了需要填补的部分的特性（平滑的还是颗粒化）。从下图可以明显看出。图像style比较平滑，则相关函数值比较大（相关性强），如果颗粒化则相关性弱使得相关函数值变小。

640?wx_fmt=png

读完此文，不由再次惊叹了卷积神经网络的强大！更多细节请点击下面“阅读原文”。

最后留一个思考题，论文提供的方法能否用来降低图像高斯噪声的影响？加有高斯噪声的图像如下所示。

640?wx_fmt=jpeg

感谢box同学推荐此论文。关于更多论文方面的讨论，欢迎加入我们的讨论组。好好学习，天天向上。

640?wx_fmt=png

往期回顾：

党给我智慧给我胆，梯度给我努力的方向

【通俗理解】凸优化

【通俗理解】区块链

外卖机器人诞生！快递小哥会失业吗？

刚刚，有位大神用AI搞定了多位女神

你敢@微信官方，不怕它真送你一顶绿色圣诞帽？

别人都在晒18岁照片，而我却在学习~

今日头条败给了色情？AI算法不行，还是另有隐情？

【机器学习】python凭什么能被纳入教材

【机器学习】朴素贝叶斯算法分析

【机器学习】主成分(PCA)算法分析

【机器学习】非线性回归算法分析

【机器学习】线性回归算法分析

读AlphaZero论文随想

进击的TensorFlow

【通俗理解】协方差

【通俗理解】贝叶斯统计

从一个双控开关思考神经网络（下）

从一个双控开关思考神经网络（上）

640?wx_fmt=jpeg

AI启蒙研究院

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
何必心中无码，AI让你眼见为实

还在为珍贵的照片，被路人抢镜而苦恼吗？还在为景区人山人海，而拍不到一人一景手足无措吗？上周，英伟达发布了一个超牛逼的AI修图技术，不需要专业的修图师进行修图，能够很完美的...
复制链接

扫一扫

AI启蒙研究院 CSDN认证博客专家 CSDN认证企业博客

码龄7年

27: 原创

-: 周排名

214万+: 总排名

20万+: 访问

: 等级

1403: 积分

98: 粉丝

43: 获赞

14: 评论

149: 收藏

私信

关注

热门文章

最新评论

AI玩捉迷藏的七点启示
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
区块链VS量子计算
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
城商行牵手流量平台，开启信用卡合作新模式
CSDN-Ada助手: 大数据如何影响传统产业，是否引发了行业革命？
人形AI捉迷藏惊煞网友：飞檐走壁纯靠自学，表情丰富还会合作
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
还在@微信官方的同学，别被骗了
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。