【论文阅读】Visual Deprojection:Probabilistic Recovery of Collapsed Dimensions

ICCV2019论文。我们在拍照时,由于设置的快门时间太长,拍出来的照片会有长长的拖影,例如车流轨迹、星轨等。然而对于一般的照片而言,我们不需要这样的拖影。这种拖影可以认为是视频在时间上投影到2D的图片上,可以认为是一种维度坍塌的过程。这篇论文提出了一种新的神经网络架构,可以反其道行之,从2D投影到恢复3D时空,也就是从运动模糊的图像中重新创建视频。通过在几个数据集上进行测试,这种网络架构可以恢复人行走的过程,从左右摆动高度模糊的图像中恢复出五官样貌,也可以恢复MNIST手写体数字的笔画形状和运动方向。

这是一篇比较硬核的论文,需要一定的数学功底,通过使用神经网络进行设定参数的求解,从而达到求解反投影的问题。这里就直接把数学公式贴出来。

然后作者设计了下面的网络用于相关参数的求解。

下图是一些可视化的结果:
从结果来看,还是有不小的提升空间的;并且如果能推数学公式然后用网络求解公式的参数,那应该很好发论文。

本文标题:【论文阅读】Visual Deprojection:Probabilistic Recovery of Collapsed Dimensions

文章作者:Zeyuxiao

发布时间:2020年03月12日 - 17:03

最后更新:2020年03月13日 - 12:03

原始链接:https://zeyuxiao1997.github.io/2020/03/12/Visual-Deprojection/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。