Zero123

3D图像生成

2024-07-22 11:00

专门设计用于生成视图条件图像。与之前的Zero123-XL相比,稳定版Zero123在生成结果上取得了显著的改进,这得益于三项关键创新。

产品参数:

收费方式

免费

产品语言

英文

开发公司

应用平台

PC,
产品介绍:


texture.gif


Zero123,我们的稳定版模型,今天正式发布,它是基于我们内部训练的先进技术,专门设计用于生成视图条件图像。与之前的Zero123-XL相比,稳定版Zero123在生成结果上取得了显著的改进,这得益于三项关键创新。


Zero123的主要创新:

  1. 改进的训练数据集:通过从Objaverse中精心筛选,我们仅保留了高质量的3D对象,使得渲染的对象在真实感上超越了以往方法。

  2. 估计的摄像机角度:在训练和推理过程中引入了对摄像机角度的估计,这种高度调节功能让模型能够做出更明智、更高质量的预测。

  3. 预先计算的数据集和改进的数据加载器:支持更高的批量大小,与改进的训练数据集相结合,使得与Zero123-XL相比,训练效率提高了40倍。

Zero123的特征:

  • 高质量的新颖视图生成:稳定版Zero123能够展示物体从各个角度的外观,表现出对3D理解的深度,生成的图像质量显著提高。

  • 与稳定扩散1.5相当的资源消耗:使用与SD1.5相同数量的VRAM生成新视图,但生成3D对象需要更多的时间和内存。

  • 开源支持:为了推动3D对象生成的开放研究,我们改进了Threestudio的开源代码,以支持Zero123和Stable Zero123。

  • 技术预览:简化版的Stable 3D流程目前处于私人预览阶段,该流程使用分数蒸馏采样(SDS)优化NeRF,并利用稳定的Zero123模型创建纹理3D网格。

Zero123项目的资源:

该模型现已在Hugging Face平台发布,供研究人员和非商业用户下载并进行实验,进一步推动AI领域的发展。


上一篇: Genie
Sloyd AI:下一篇