Audio2Photoreal
数字人
2024-10-27 15:10
能够根据音频输入生成逼真的全身虚拟人物形象。
项目参数:
项目介绍:
音频到形象生成:从多人对话中生成对应的逼真面部表情和身体动作。
细节捕捉:精确反映对话中的细微手势和表情,如指点、微笑、耸肩等。
动态表现力:生成具有动态性和表现力的动作,增强虚拟人物的真实感。
数据集捕获:通过捕获丰富的双人对话数据集,为逼真重建提供支持。
运动模型构建:构建包含面部运动、姿势预测和身体运动的复合模型。
面部运动生成:利用唇部回归器处理音频,提取面部特征,并通过条件扩散模型生成面部运动。
身体运动生成:输入音频,输出VQ引导姿势,并结合扩散模型生成高频身体运动。
虚拟人物渲染:将面部和身体运动数据传入渲染器,生成逼真的虚拟人物形象。
结果展示:展示根据音频生成的全身虚拟人物,表现出对话中的细微表情和手势动作。
向量量化样本多样性:结合了向量量化技术,提高了样本的多样性。
高频细节生成:通过扩散模型,生成具有高频细节的动态动作。
逼真重建:利用丰富的数据集和先进的运动模型,实现逼真的虚拟人物重建。
上一篇:
Make-A-Character
下一篇:
DreamTalk