想做口播又不想出镜?没设备、不会剪辑、嫌麻烦?数字人口播就是为你准备的。给一张正脸照、配一段录音,AI 帮你生成一个会说话、嘴型对得上的人在镜头里讲解。一个人在家就能批量出片。
先搞懂:这是「形象 + 声音」拼起来的
数字人口播不是一个按钮搞定,它是个组合流程,说白了就两件事拼到一起:
- 一张脸:选平台现成的数字人形象,或者传你自己的一张正脸照(数字人 15 灵极币/次)。
- 一段声音:上传你自己录的音频,或者用语音克隆生成一段(声音对口型走「语音口型」,10 灵极币/秒)。
把这两样喂给 AI,它就生成一段嘴型跟着声音动、像真人在说话的视频。听起来玄乎,做起来就三步。
配图位 · 视频创作里的数字人 / 语音口型入口
三步做出会说话的口播视频
- 第一步:定好你的「主播脸」 进「视频创作」,挑一个你喜欢的数字人形象,或者传一张你自己的正脸照。脸要正、要清楚,嘴自然微微张开一点点最好(后面对口型更准)。这一步走数字人,15 灵极币一次。
- 第二步:准备声音 两条路:① 直接传你自己录的音频(手机录就行);② 不想自己念,就用语音克隆生成一段配音。建议音频先控制在 5 到 15 秒,短一点对口型最清晰,长段落容易出错就拆成几条做。
- 第三步:生成对口型视频 把脸和音频丢进「语音口型」,它会让人物的嘴跟着声音动。这步按音频秒数算钱,10 灵极币/秒,比如一段 10 秒的口播大概 100 灵极币。生成按钮上会直接写「生成 · N 灵极币」,花多少一目了然。点下去等一会儿,你的数字人主播就开口说话了。
💡 放心点:万一生成失败(服务器忙或文件没识别好),灵极币会自动退回账户,提示「生成失败,灵极币已自动退还,请稍后重试」,不会白扣,大胆试。
现在就去视频创作做一条口播
对口型清不清晰,全看这几个细节
同样是数字人,有人做出来嘴型对得严丝合缝,有人做出来一看就假。差距就在下面这几条:
- 用正脸图:脸越正、五官越清楚,对口型越准。侧脸、低头、戴口罩都不行。
- 嘴自然微张:照片里嘴稍微张开一点点,AI 更容易接管嘴型;嘴闭太死反而别扭。
- 音频别太长:5 到 15 秒一段最稳。长段落拆成几条分别做,再接起来。
- 录音背景要安静:噪音大、回声重,AI 容易把杂音也当成说话,对口型就乱了。找个安静屋子录。
⚠️ 最容易翻车的一点:运动强度别调太高。很多人觉得人物动得越多越生动,结果一调高,头一晃、身子一扭,嘴型同步就被带乱了,看着像卡了。做口播就是要稳稳地说话,运动强度往低了给,对口型才干净。
这个能拿来干嘛赚钱
数字人口播是普通人最容易变现的一块。你不用露脸、不用每天对着镜头,照样能批量出片:
- 口播带货:给商品配一段讲解口播,一天能出十几条挂车视频,不用真人天天播。
- 虚拟主播:捏一个固定形象当你的账号主播,长期用同一张脸做人设。
- 知识博主做分身:把你的课程、干货写成文案配音,让数字人替你讲,省下大把录制时间。
- 产品讲解视频:帮商家做产品介绍、使用说明,接单收钱,一个人就是一个工作室。
会做数字人口播,等于多了一个不用睡觉、不用化妆、随时能开播的「员工」。