为帮助AI数字人类落地,FACEGOOD(Quantum Power)正式开源音频驱动表达技术Audio2Face技术。 本文是对该技术的简要概述。
目前,在元宇宙的热潮下,AI数字人也开始涉足多个领域,包括娱乐、服务、教育、营销等。市场上出现的AI数字人包括功能性AI数字人,比如虚拟助手等。 、虚拟导游、虚拟客服等; 陪伴型AI数字人,如虚拟伴侣、虚拟家庭成员等; 社交AI数字人,如虚拟主播、虚拟偶像、虚拟老师、虚拟医生、虚拟导购等。
浦发银行首位银行数字化员工“小浦”
虎牙AI数字人万域
搜狐新闻客户端与搜狗推出的首个明星“AI数字人”主播。
为了实现虚拟数字人的多领域渗透,让更多的AI数字人场景得以落地,FACEGOOD决定正式开源语音驱动唇动的算法技术。 这就是AI虚拟数字人的核心算法。 降低AI数字人的开发门槛。
项目地址:
项目背景
2019年ai虚拟数字人软件有哪些,第十届中国国际新媒体短片节组委会与FACEGOOD联合发布了陆川执导的AI数字人。
陆川执导的AI数字人像
观众可以与AI数字陆川面对面互动卡通人物,为观众带来打破虚拟空间与现实空间之间次元壁的实时互动体验。 为了达到实时交互的效果,FACEGOOD开发了一套数字人实时语音交互系统,实现了从语音到表情动画的实时转换。
今天吉祥物设计,FACEGOOD选择开源全套语音驱动表情的技术代码,免费提供给数字人类开发者。
技术解读
该技术可以将语音实时转换为富有表现力的混合形状动画。 原因在于,在当前行业中,利用BS来驱动数字图像的动画表达仍然是主流,这方便动画艺术家对最终的动画输出进行最艺术的调整。 他们之间的转移等
根据这些实际生产需求,FACEGOOD对输入输出数据进行了相应的调整。 声音数据对应的标签不再是模型动画的点云数据,而是模型动画的blendshape权重。 最终的使用流程如下图1所示:
上述流程中,FACEGOOD主要完成Audio2Face部分,ASR和TTS则由Smart Robot完成。 如果您想使用自己的语音,或者第三方语音,ASR和TTS可以自行替换。
当然,FACEGOOD Audio2face部分也可以根据自己的喜好重新训练。 例如,如果您想使用自己的语音或其他类型的声音ai虚拟数字人软件有哪些,或者使用不同的模型绑定作为驾驶数据,您可以按照下面提到的过程进行操作。 拥有专属的动画驱动算法模型训练。
那么Audio2Face这一步的框架是什么呢? 以及如何制作自己的训练数据? 详细信息如下图2所示:
常规的神经网络模型训练大致可以分为三个阶段:数据收集和制作、数据预处理和数据模型训练。
- 本文固定链接: https://wen.nuanque.com/aigc/10497.html
- 转载请注明: nuanquewen 于 吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计 发表
- 文章或作品为作者独立观点不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。本文之内容为用户主动投稿和用户分享产生,如发现内容涉嫌抄袭侵权,请联系在线客服举报,一经查实,本站将立刻删除。本站转载之内容为资源共享、学习交流之目的,请勿使用于商业用途。