3D重建

共 3 篇网址

排序

发布更新浏览点赞

CAT4D

CAT4D是一个利用多视图视频扩散模型从单目视频中生成4D场景的技术。它能够将输入的单目视频转换成多视角视频，并重建动态的3D场景。这项技术的重要性在于它能够从单一视角的视频资料中提取并重建出三维空间和时间的完整信息，为虚拟现实、增强现实以及三维建模等领域提供了强大的技术支持。产品背景信息显示，CAT4D由Google DeepMind、Columbia University和UC San Diego的研究人员共同开发，是一个前沿的科研成果转化为实际应用的案例。

010

视频创作 # 3D重建 # 4D场景 # 增强现实

PSHuman

PSHuman是一个创新的框架，它利用多视图扩散模型和显式重构技术，从单张图片中重建出逼真的3D人体模型。这项技术的重要性在于它能够处理复杂的自遮挡问题，并且在生成的面部细节上避免了几何失真。PSHuman通过跨尺度扩散模型联合建模全局全身形状和局部面部特征，实现了细节丰富且保持身份特征的新视角生成。此外，PSHuman还通过SMPL-X等参数化模型提供的身体先验，增强了不同人体姿态下的跨视图身体形状一致性。PSHuman的主要优点包括几何细节丰富、纹理保真度高以及泛化能力强。

010

图像生成 # 3D重建 # 人体模型 # 人工智能

LucidFusion

LucidFusion是一个灵活的端到端前馈框架，用于从未摆姿势、稀疏和任意数量的多视图图像中生成高分辨率3D高斯。该技术利用相对坐标图（RCM）来对齐不同视图间的几何特征，使其在3D生成方面具有高度适应性。LucidFusion能够与原始单图像到3D的流程无缝集成，生成512x512分辨率的详细3D高斯，适合广泛的应用场景。

020

图像生成 # 3D重建 # 多视图图像 # 相对坐标图