ICCV2019论文。我们在拍照时,由于设置的快门时间太长,拍出来的照片会有长长的拖影,例如车流轨迹、星轨等。然而对于一般的照片而言,我们不需要这样的拖影。这种拖影可以认为是视频在时间上投影到2D的图片上,可以认为是一种维度坍塌的过程。这篇论文提出了一种新的神经网络架构,可以反其道行之,从2D投影到恢复3D时空,也就是从运动模糊的图像中重新创建视频。通过在几个数据集上进行测试,这种网络架构可以恢复人行走的过程,从左右摆动高度模糊的图像中恢复出五官样貌,也可以恢复MNIST手写体数字的笔画形状和运动方向。
这是一篇比较硬核的论文,需要一定的数学功底,通过使用神经网络进行设定参数的求解,从而达到求解反投影的问题。这里就直接把数学公式贴出来。
然后作者设计了下面的网络用于相关参数的求解。
下图是一些可视化的结果:
从结果来看,还是有不小的提升空间的;并且如果能推数学公式然后用网络求解公式的参数,那应该很好发论文。