喻旭:数字人语音播报,5步制作过程
近期参加了微盟集团在杭州服饰头部企业卓尚服饰会议中心举办的数字化论坛。我将自己的发言内容写成了新闻稿,再借助数字人进行新闻播报。
具体怎么做的呢?
第1步:喂投ChatGPT,提供关键信息。
包括:
- 【你是谁】:你现在新闻编辑
- 【我是谁】:我是一场论坛的演讲嘉宾
- 【我要做什么】:我叫喻旭,我做了一场20分钟的演讲,需要写新闻稿
- 【你的任务】:请你帮我写一篇新闻稿
- 【你的目标】:报道我受邀参加论坛,成功演讲,并引起系列好评
- 【喂投内容】:主办时间6月27日,主办方微盟集团、中国纺织品商业协会服装商贸专业委员会、主办地在杭州卓尚服饰会议中心,论坛主题是《智慧服饰增长有质》。喻旭分享的主题是《品牌如何以数字化构件增长新路径》,喻旭分享的内容包括:AI新技术在服饰销售场景的应用,……论坛中,微盟提供了喻旭专著书籍《企业数字化转型指南》,喻旭签名赠送与会嘉宾。整个论坛受到一致好评,圆满成功。
- 【约束条件】:为本次论坛写3个嘉宾好评,好评内容要包括:喻旭、数字化内容
如下图:
但是,ChatGPT的回复字数有限制,我用的这个平台回复不超过800字,此时,不要担心,你只需要再次输入“继续”,他将回复之前没有回复完的内容。如下图:
第2步:适当修改,调整语气。
GPT的回复有点夸张,对我一个劲的猛夸,说:“喻旭的分享开启了数字化时代的新篇章,为整个行业带来了新的思维和机遇,相信在喻旭先生的引领下,行业将迎来更加光明和创新的未来”,这个实在不敢当,我就把这段话给去掉了。当然,GPT这么夸我,还是挺爽的。
第3步:录制播报语音
数字人可以训练口音的,就像百度导航里,可以模拟人的声音,只要给他几段你讲话的音频,他后面就会模仿你的声音。本次,因为播报篇幅不大,我没有使用语音模拟软件,而是直接用电脑录音,生成录音文件。
第4步:使用D-ID,制作数字人播报视频
地址在这里:Create Video (d-id.com),
https://studio.d-id.com/editor
上传你的图片,以及事先录制好的语音,自动生成动态视频。非常简单,傻瓜化操作。
包括:上传照片与语音
- 上传你的图片:图片最好是纯色背景,头部轮廓清晰显示出来,不要融于背景中。另外,嘴巴要闭着,不要张开,嘴唇保持自然放松状态,因为嘴巴最容易露馅。
- 制作语音,两种方式:
一种是系统根据文本,自动生成语音,可以选择语言、播报员以及语气(平和的、生气的、温柔的、聊天式的……),如下图:
另一种,上传你事先准备好的语音,我选的便是这种。
第5步:用剪映剪辑
在视频里穿插一些新闻现场的视频片段,这样会显得更加真实。如下图:
以上是我的数字人制作过程,欢迎交流。
关注:喻旭 公众号 | 关注:喻旭 个人号 |