DIRFA:​只需音频和照片即可创建逼真的说话脸部动画

投稿号(tougaohao.com)11月17日 消息:新加坡南洋理工大学(NTU Singapore)的一支研究团队开发了一个计算机程序,只需音频和一张照片,即可创建反映说话者面部表情和头部动作的逼真视频。

这个名为 DIverse yet Realistic Facial Animations(DIRFA)的人工智能程序能够根据音频和照片生成3D 视频,显示人物与所说的音频同步的逼真而一致的面部动画。该程序改进了现有方法,解决了姿势变化和情感控制等问题。

DIRFA:​只需音频和照片即可创建逼真的说话脸部动画

为了实现这一目标,研究团队训练 DIRFA 使用了来自一个名为 The VoxCeleb2Dataset 的开源数据库的超过6000人的100多万个音频视频片段,以预测语音中的线索并将其与面部表情和头部动作联系起来。

研究人员表示,DIRFA 可能在各个行业和领域中产生新的应用,包括医疗保健。它可以使虚拟助手和聊天机器人更加复杂和逼真,从而改善用户体验。此外,它还可以作为一种强大的工具,帮助言语或面部受损的人通过表情丰富的化身或数字形象来传达他们的思想和情感,提高他们的沟通能力。

该研究的的研究人员表示:“我们的研究影响可能是深远的,因为它通过结合人工智能和机器学习等技术,彻底改变了多媒体通信的领域。我们的程序在之前的研究基础上进行了改进,只使用音频记录和静态图像,就能生成具有准确的嘴唇动作、生动的面部表情和自然的头部姿势的视频。”

研究人员还介绍称:“语音表现出多种变化。在不同的语境下,个体对相同的词语发音可能会有不同的方式,包括持续时间、幅度、音调等方面的变化。此外,除了语言内容,语音还传达了有关说话者情感状态和性别、年龄、种族甚至个性特征等身份因素的丰富信息。我们的方法在音频表示学习和人工智能机器学习方面进行了开创性的努力。” 研究结果于8月份发表在《Pattern Recognition》科学期刊上。

研究人员表示,通过音频驱动逼真的面部表情呈现是一个复杂的挑战。对于给定的音频信号,可能有许多可能的面部表情是合理的,而在处理随时间变化的一系列音频信号时,这些可能性可能会增加。

由于音频通常与嘴唇动作有很强的联系,但与面部表情和头部位置的联系较弱,研究团队的目标是创建能够展示精确的嘴唇同步、丰富的面部表情和与提供的音频相对应的自然头部动作的说话脸部。

为了解决这个问题,研究团队首先设计了他们的人工智能模型 DIRFA,来捕捉音频信号和面部动画之间复杂的关系。他们使用来自一个公开可用的数据库的超过6000人的100多万个音频和视频片段对模型进行了训练。

研究人员介绍:“具体而言,DIRFA 模型根据输入的音频来建模面部动画(如挑起眉毛或皱鼻子)的可能性。这种建模使得该程序能够将音频输入转换为多样而逼真的面部动画序列,从而指导说话脸部的生成。”

研究人员还补充说:“广泛的实验表明,DIRFA 能够生成具有准确的嘴唇动作、生动的面部表情和自然的头部姿势的说话脸部。然而,我们正在努力改进程序的界面,使得用户能够对某些输出进行控制。例如,DIRFA 目前不允许用户调整某种表情,比如将皱眉改为微笑。”

除了向 DIRFA 的界面添加更多选项和改进外,NTU 的研究人员还将使用更广泛的数据集来微调其面部表情,包括更多种类的面部表情和声音音频片段。

论文地址:

https://www.ntu.edu.sg/docs/default-source/corporate-ntu/hub-news/realistic-talking-faces-created-from-only-an-audio-clip-and-a-person-s-photo-using-ntu-singapore-computer-program.pdf?sfvrsn=41d32b2a_1

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年11月17日 12:08
下一篇 2023年11月17日 12:15

热点推荐

  • 李玟曾饱受离婚困扰 前夫多次出轨 真是难以置信一代歌神就这么没了

    7月5日,娱乐圈传来噩耗,女歌手李玟抑郁症去世,年仅48岁。 消息又李玟的亲姐姐李思林宣布,她在个人微博表示:“我们怀着极度哀伤的心情,告诉大家一个悲痛的消息:CoCo于数年前不幸患上了抑郁症,经过长时间与病魔斗争,可惜近日病情急…

    热点 2023年7月6日
    133
  • 女子喝白酒死亡同桌3闺蜜担责 4种行为同桌饮酒者需承担法律责任

    据CCTV今日说法12月14日消息:2023年5月21日傍晚,江西南昌的小秋(化名)因情伤心情低落,自行去了朋友王琪(化名)家中,与朋友王琪、徐恬(化名)和陈朵(化名)聚餐以缓解悲伤情绪。 期间,小秋喝了一斤左右的白酒,王琪喝了半…

    热点 2023年12月16日
    102
  • 三河公立幼儿园收费标准(三河市幼儿园排名)

    三河的私立幼儿园有哪些 新都区三河街道民办幼儿园有锦绣前程幼儿园,金艺智能幼儿园,成都市新都区菲乐幼儿园3家。 爱贝蓝岛幼儿园。爱贝蓝岛幼儿园是一所民办私立国际幼儿园,配有多功能活动室、图书室、美工室等专用活动室。位于北京市通州区…

    热点 2023年12月22日
    123
  • 是谁修复了她折戟的翅膀-记智慧家梁秋娇

    每一次都在徘徊孤单中坚强,每一次就算很受伤也不闪泪光,我知道,我一直有双隐形的翅膀,带我飞,飞过绝望。不去想,他们拥有美丽的太阳,我看见,每天的夕阳也会有变化。我知道,我一直有双隐形的翅膀,带我飞,给我希望! 今天约好我和她见面,…

    热点 2022年10月23日
    162
  • 农村饮水安全问题实现历史性解决

    9月13日,中宣部举行“中国这十年”系列主题发布会,介绍党的十八大以来水利发展取得的成就。水利部部长李国英介绍,十年来,我国水利部门锚定全面解决农村饮水安全问题这一打赢脱贫攻坚战的重要指标,全面解决了1710万建档立卡贫困人口饮水…

    热点 2022年9月18日
    135
  • 世界十大名画排名前十名(世界十大名画排名)

    世界十大名画有哪些画 1、世界十大名画有《蒙娜丽莎》、《最后的晚餐》、《格尔尼卡》、《星月夜》、《大宫女》、《戴珍珠耳环的少女》、《维纳斯的诞生》、《创造亚当》、《亚维农的少女》、《日出·印象》。 2、《双臂抱胸的女人》毕加索 2…

    热点 2023年12月30日
    151
  • 网站关键词优化的4种方法(网站关键词优化的方法有哪些)

    在现代企业与产品营销当中,利用网络资源获取更多的客户从而更好的促进销售越来越多,而网站在现代营销行业当中所起到的作用也让大家有目共睹,那么想要更好的发挥网站的这一价值作用所在,对网站的优化操作处理则是非常重要的,通过优化可以更好的…

    热点 2022年10月11日
    154
  • 美光:未来几年将在西安投资43亿元

    6月16日,美光科技宣布,计划在未来几年中对其位于中国西安的封装测试工厂投资逾43亿元人民币。公司已决定收购力成半导体(西安)有限公司(力成西安)的封装设备,还计划在美光西安工厂加建新厂房,并引进全新且高性能的封装和测试设备。 美…

    热点 2023年6月27日
    130
  • 微商怎么做营销做微商如何推广更有效

    无论是微商营销或者其他,没有神马东西是不劳而获的,这里说的也是个人的经验以及给大家唠叨一下!微信营销为啥这么重要?因为现在基本人人都有手机,人人手机里面都有微信,尤其是城市里面工作有经济支配权的白领!人人都习惯一天打开很多次微信,…

    热点 2022年10月6日
    141
  • (财经·行情)芝加哥农产品期价24日下跌

    新华社芝加哥10月24日电(记者徐静)芝加哥期货交易所玉米、小麦和大豆期价24日全线下跌。 当天,芝加哥期货交易所玉米市场交投最活跃的12月合约收于每蒲式耳6.815美元,比前一交易日下跌2.75美分,跌幅为0.4%;小麦12月合…

    热点 2022年10月25日
    137

发表回复

登录后才能评论