New Topic For Me to explore! 对我来说正式开启3D Image~
首先我是看了两篇review了解了这个topic的主要任务:
另外同步阅读了huggingface的tutorial:https://huggingface.co/learn/computer-vision-course/unit8/3d-vision/nvs
。这篇博客将NVS描述为这样一个任务:
generate views from new camera angles that are plausibly consistent
with a set of images.
我们在对一个场景进行3D还原时,首先的输入是一系列相机在不同的视角拍摄的静态图片,通过这些图片我们对该场景下的人物以及物体进行3D建模,但相机个数是有限的,如何推算出某个没有相机的角度上的view,这就是NVS这个任务要做的事情。
很多方法在这个topic上提出来,大致可以分成两类:1)generate an
intermediate three-dimensional representation, which is rendered from a
new viewing direction. 比如PixelNeFRF 2)direclty generated new views
without an intermediate 3D representaion, 比如Zero123
2025.6.24 补充
对于该领域的scene的生成,24年google的4D Gaussian
Splatting提出后,把NVS分为两部分,一部分是以Nerf和3DGS为代表的基于静态图片生成3D场景,另外一部分是dynamic
scenes,这里的dynamic指的是与3DGS处理的某一时刻的scene不同,这里要处理的数据加入了时序特征,场景中有动态的物体或者人,比如行人或者行驶的车辆。4DGS在一定程度上解决了真正的real-time的问题。