京东数科自主研发AI主播出道 可在多领域应用

作者:张伟 来源:原创 2020-05-29

  日前,AI主播亮相京东数科产业AI公开课,其便是由京东数科自主研发的AI虚拟主播“小妮”,小妮是基于京东数科AI实验室在文字转语音、3D人脸建模、语音转视频等领域上的创新所打造的,自然的表情以及语义方面的理解,让小妮拥有了跟人类主播一样的既视感。

  在语音生成视频的阶段,为了使AI主播形象更加逼真,京东数科AI实验室利用对抗生成网络来还原更真实的表情,通过3D模型运动追踪技术来确保AI主播在说话时口型准确、表情细腻、头部运动自然。但2D类模型往往能生成更细腻的画质,3D方向的模型操控能力更佳,为何使两者能够进行完美结合,京东数科在2D和3D模型之上各取所长,将最新的深度学习技术与传统的优化技术和特征提取技术相结合,使语音、图像、视频这些模态间的语义打通成为可能。

  从实际效果来看,AI虚拟数字人能够模仿不同人的说话习惯,学到如何用点头、眨眼这些细微动作对发言中的重要内容加以强调。为了在口型匹配方面达到完美效果,京东数科借助大量语音数据,并特意设计了鲁棒的语音特征,使其可以被不同音色、语言和语速的合成语音所驱动,且都能保持准确、连贯的口型。

  京东数科AI实验室首席科学家薄列峰表示:“AI主播小妮的推出,是京东数科在多模态AI技术领域一次成功的落地应用。除了在客服、招聘等领域的应用之外,还可服务于内容创造者,通过AI虚拟数字人技术,把静态图文内容转化为由‘真人’讲解的短视频,满足用户对多样化呈现形式的需求。”

发布
X
第三方账号登录
  • 微博认证登录
  • QQ账号登录
  • 微信账号登录