paper reading
john_xia
17岁的编程少年
展开
-
【paper reading】Uncalibrated Photometric Stereo under Natural Illumination
经典的photometric stereo方法对于实验设置主要有两个假设:1.已标定方向和亮度的平行光;2.朗伯表面的物体反射。近些年来,很多研究都致力于放宽这两方面的假设使ps方法能够更加适用于实际应用。其中对于光照的假设,几年前很多研究使用未标定或者半标定(只标定光源位置,不标定光源亮度)的点光源,现在的模型则更多的使用二阶球谐函数近似的自然光照模型从而应对更加接近现实世界的场景。同样,本文的方法主要是为了对第一种假设进行放宽,提出了一种对朗伯物体在未标定自然光下的表面恢复方法。原创 2019-05-07 10:08:17 · 1319 阅读 · 0 评论 -
【paper reading】Self-calibrating Deep Photometric Stereo Networks
这篇论文中,作者提出了一种基于深度学习的uncalibrated photometric stereo方法。在photometric stereo领域中的一些传统方法由于场景复杂度的限制,通常会对物体表面的反射属性或者光源的分布进行各种假设。但是本方法致力于放宽这一限制,在未知的照明方向下对任意反射属性的物体进行表面恢复,同时标定出照明的方向和亮度。原创 2019-04-10 19:49:06 · 1258 阅读 · 0 评论 -
【paper reading】Multiview Shape and Reflectance from Natural Illumination
这篇文章是CVPR' 14上的,虽然有点老,但是它的做法很有借鉴性,对于基于光度信息进行重建方法怎么融合多个视角下的信息生成更加精确的法向量很有意思。通过RGB图像的光度反射信息恢复物体的表面一直是一个不断在研究的方向。本论文的方法中并不致力于提出精细的反射模型,而是将问题通过基于概率的几何估计方法进行解决。原创 2019-03-26 14:58:26 · 345 阅读 · 0 评论 -
【paper reading】Detailed Surface Geometry and Albedo Recovery from RGB-D Video Under Natural Illumina
这篇论文是百度的杨睿刚老师之前在ICCV' 17上的工作。论文中使用二代kinect,把相机固定在一个位置上,然后物体在自然环境照明下在画面内运动,最后拍摄物体运动的RGB-D图像序列。通过RGB-D图像序列来恢复精细的物体三维形状。整个方法对于物体的运动以及照明情况没有什么先验的要求,但是它要求物体是漫反射的。原创 2019-03-12 21:36:45 · 413 阅读 · 0 评论 -
【paper reading】Learning Shape Priors for Single-View 3D Completion and Reconstruction
今天这篇是ECCV' 18上的一篇文章。可以看成是对GAN的一个成功应用,整个工作可能没有太多让人眼前一亮的地方,但是有些实验会比较有意思。这个工作的目的就是从单张图像(可以是深度图也可以是RGB图像)中重建出完整的物体的三维形状。这个问题很明显是一个不可能完成的问题,因为仅从单个视角观察物体,由于遮挡的原因,是绝不可能得到物体完整的真实形状,肯定会存在歧义。原创 2019-03-20 20:28:04 · 1388 阅读 · 1 评论 -
【paper reading】InverseRenderNet: Learning single image inverse rendering
这篇论文和之前paper reading中的SfSNet那篇有相似之处,可以对比观看。和SfSNet一样,InverseRenderNet也是输入一张真实世界中拍摄的RGB图像,在朗伯假设下,从图像中分解出形状,反照率,然后计算出光照。原创 2019-03-10 17:22:02 · 2222 阅读 · 1 评论 -
【paper reading】SfSNet: Learning Shape, Reflectance and Illuminance of Faces in the Wild
这篇文章是CVPR' 18上的一篇工作。SfS(Shape from Shading)是通过分析单张图像中的明暗信息来判断物体表面的法线方向,从而恢复表面形状的方法。这个工作的目的就是输入一张在真实世界中拍摄的环境不受限的128*128大小的RGB人脸图像,在朗伯假设下,将图像分解为形状,反射和光照三方面的信息。原创 2019-03-07 09:40:12 · 3066 阅读 · 0 评论 -
【paper reading】MVSNet: Depth Inference for Unstructured Multi-view Stereo
MVSNet,顾名思义,就是非结构化多视图的三维重建网络,它的输入这里要注意的是不仅仅是多个视角下拍摄的图像,还包含相机的信息,然后输出是每个视图下的深度信息,最终可以将这些深度信息融合得到最终的三维点云。原创 2019-03-04 14:51:41 · 4858 阅读 · 13 评论 -
【paper reading】Interpret Neural Networks by Identifying Critical Data Routing Paths
现在深度学习依靠大数据加上现在比较充足的计算能力,神经网络十分火热,也在很多方面有很好的应用。现在cvpr之类的顶级会议很多论文都是基于神经网络的研究。但现在有一个问题,就是神经网络究竟是怎么工作的,它运行的机理到底是什么样的,大家其实不是特别清楚。对于深度学习模型的可解释性,也就是我们想要知道它内部的工作机理是什么样的,为什么会发生错误,什么情况下会发生错误,这方面的研究也是很受关注。包括美国的一些相关科研机构都把可解释性的机器学习作为深度学习下一代的比较有代表性的模型。原创 2019-05-27 14:20:21 · 759 阅读 · 0 评论