MVS学习笔记(1)——语义三维重建入门

1. 基本概念

语义三维重建是近几年开始出现的一种三维重建概念和技术。其目标是通过项目恢复场景几何信息的同时标识出三维场景中具有独立语义类别的部分1。这样可以解决很多三维重建无法解决的问题,例如能够回答重建结果中建筑物的体积等需要了解三维模型代表具体地物类型的问题。而在同步解决三维重建和场景语义分割的过程中,很多其他类型的先验知识可以加入到算法中,例如地面(Ground)类型的目标物在水平方向具有相似高程。

在三维语义重建中使用的重建技术手段是在传统基于"SFM->深度图->Mesh"流水线过程中,在深度图到Mesh的过程中,使用基于Volumetric的方法,也就是基于体素的Mesh模型恢复方法。但是普通的基于体素的三维重建方法是将体素分类2类——有物体和无物体,而语义三维重建则是认为体素可以有更多的标签。因此在恢复三维体素的过程中能够同步实现场景的分类,同时恢复场景三维时时所需计算能力和内存也更高,对算法的优化提出了更高的要求。

参考资料


  1. CVG @ ETHZ - Semantic 3D Modeling↩︎