首页 > AIGC > ai虚拟数字人软件有哪些-为了开发自己的数字人,FACEGOOD开放了语音驱动表达技术
2023
08-13

ai虚拟数字人软件有哪些-为了开发自己的数字人,FACEGOOD开放了语音驱动表达技术

为帮助AI数字人类落地,FACEGOOD(Quantum Power)正式开源音频驱动表达技术Audio2Face技术。 本文是对该技术的简要概述。

目前,在元宇宙的热潮下,AI数字人也开始涉足多个领域,包括娱乐、服务、教育、营销等。市场上出现的AI数字人包括功能性AI数字人,比如虚拟助手等。 、虚拟导游、虚拟客服等; 陪伴型AI数字人,如虚拟伴侣、虚拟家庭成员等; 社交AI数字人,如虚拟主播、虚拟偶像、虚拟老师、虚拟医生、虚拟导购等。

浦发银行首位银行数字化员工“小浦”

虎牙AI数字人万域

搜狐新闻客户端与搜狗推出的首个明星“AI数字人”主播。

为了实现虚拟数字人的多领域渗透,让更多的AI数字人场景得以落地,FACEGOOD决定正式开源语音驱动唇动的算法技术。 这就是AI虚拟数字人的核心算法。 降低AI数字人的开发门槛。

项目地址:

项目背景

2019年ai虚拟数字人软件有哪些,第十届中国国际新媒体短片节组委会与FACEGOOD联合发布了陆川执导的AI数字人。

陆川执导的AI数字人像

观众可以与AI数字陆川面对面互动卡通人物,为观众带来打破虚拟空间与现实空间之间次元壁的实时互动体验。 为了达到实时交互的效果,FACEGOOD开发了一套数字人实时语音交互系统,实现了从语音到表情动画的实时转换。

今天吉祥物设计,FACEGOOD选择开源全套语音驱动表情的技术代码,免费提供给数字人类开发者。

技术解读

该技术可以将语音实时转换为富有表现力的混合形状动画。 原因在于,在当前行业中,利用BS来驱动数字图像的动画表达仍然是主流,这方便动画艺术家对最终的动画输出进行最艺术的调整。 他们之间的转移等

根据这些实际生产需求,FACEGOOD对输入输出数据进行了相应的调整。 声音数据对应的标签不再是模型动画的点云数据,而是模型动画的blendshape权重。 最终的使用流程如下图1所示:

上述流程中,FACEGOOD主要完成Audio2Face部分,ASR和TTS则由Smart Robot完成。 如果您想使用自己的语音,或者第三方语音,ASR和TTS可以自行替换。

当然,FACEGOOD Audio2face部分也可以根据自己的喜好重新训练。 例如,如果您想使用自己的语音或其他类型的声音ai虚拟数字人软件有哪些,或者使用不同的模型绑定作为驾驶数据,您可以按照下面提到的过程进行操作。 拥有专属的动画驱动算法模型训练。

那么Audio2Face这一步的框架是什么呢? 以及如何制作自己的训练数据? 详细信息如下图2所示:

常规的神经网络模型训练大致可以分为三个阶段:数据收集和制作、数据预处理和数据模型训练。

最后编辑:
作者:nuanquewen
吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计