上传人物视频和音频,AI自动生成对口型视频。适合配音、翻译等场景。
MP4/WebM,最大 50MB,最长 15 秒(建议 5-10 秒),正面清晰人像
支持 MP3/WAV/FLAC,最大 15MB,建议时长 10-60 秒
上传人像和音频,点击生成