开源项目
ChatAnyone,阿里推出的使用分层运动扩散模型生成风格化的实时肖像视频,可以生成从整个头部到上半身互动的高保真动画结果,并具有多种面部表情和风格控制
让我们看看演示视频吧! ChatAnyone,阿里推出的使用分层运动扩散模型生成...
LeX-Art,通过可扩展的高质量数据合成重新思考文本生成,可以在图像中生成清晰、对齐良好且美观的文本
LeX-Art,通过可扩展的高质量数据合成重新思考文本生成,可以在图像中生成清晰...
FirePlace,对 3D 对象放置常识推理,可根据语言指令为要插入 3D 场景的新 3D 对象生成对象位置
让我们看看演示视频吧! FirePlace,对 3D 对象放置常识推理,可根据语...
Bottleneck-Sampling,无需训练的框架,它利用低分辨率先验来减少计算开销,同时保持输出保真度
Bottleneck-Sampling,无需训练的框架,它利用低分辨率先验来减少...
Geometry-Aware,用于多视图场景修复的模型,3D版inpaint,能在3D场景中添加、删除物体
让我们看看演示视频吧! Geometry-Aware,用于多视图场景修复的模型,...