HunyuanVideo-Avatar,腾讯开源的动态一致的音频驱动多角色人体动画,支持多样式、多物种场景,擅长多角色交互,上传照片 + 音频 - 自动检测场景背景和情感,然后生成具有动态视觉效果的逼真语音/歌唱。

Github地址:https://github.com/Tencent-Hunyuan/HunyuanVideo-Avatar

论文地址:https://arxiv.org/pdf/2505.20156

在线体验:https://hunyuan.tencent.com/modelSquare/home/play?modelId=126



微信扫描下方的二维码阅读本文

HunyuanVideo-Avatar,腾讯开源的动态一致的音频驱动多角色人体动画,支持多样式、多物种场景,擅长多角色交互插图

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。