Let Them Talk
该项目名为 “Let Them Talk”,是一个音频驱动的多人对话视频生成框架。它的主要功能、核心要点和关键特性可以概括为以下几点:
- 多功能性: 能生成多人对话视频、唱歌视频、具有交互控制的视频以及卡通视频。
- 逼真的对话: 支持单人和多人视频生成。
- 可交互的角色控制: 允许通过提示词(prompts)直接控制虚拟人物的行为。
- 泛化性能强: 不仅支持生成真人视频,也支持生成卡通人物视频和唱歌视频。
- 灵活的分辨率: 支持480P和720P输出,并且可以自定义长宽比。
- 长视频生成: 支持生成最长达15秒的视频。
- 开源发布: 已经发布了权重和推理代码,技术报告和项目页面。