上传人物照片和音频,AI自动生成说话或唱歌的数字人视频。
图片最大 8MB,建议正面清晰人像,分辨率不低于512x512
支持 MP3/WAV/FLAC,最大 15MB,建议时长 10-60 秒
上传人像和音频,点击生成