百科首页 > 正文

AI合成主播（全球首个全仿真智能AI主持人）

127次浏览 | 更新时间：2022-12-08

来源：网络整理

精选百科

本文由作者推荐

AI合成主播

全球首个全仿真智能AI主持人

“AI合成主播”是2018年11月7日第五届世界互联网大会上，搜狗与新华社联合发布的全球首个全仿真智能AI主持人。通过语音合成、唇形合成、表情合成以及深度学习等技术，克隆出具备和真人主播一样播报能力的“AI合成主播”。

2020年5月25日，全球首位3D版AI合成主播在两会正式亮相，展示传播方式新格局。^[10]

中文名

AI合成主播

研发单位

新华社、搜狗

发布时间

2018年11月7日

类型

性质

AI主持人

主播介绍

“AI合成主播”是在搜狗“分身”技术的支持下，^[1]通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项前沿技术，^[1]并结合语音、图像等多模态信息进行联合建模训练后，生成与真人无异的AI分身模型。^[2]该项技术能够将所输入的中英文文本自动生成相应内容的视频，并确保视频中音频和表情、唇动保持自然一致，展现与真人主播无异的信息传达效果。

“AI合成主播”不仅有中文“AI合成主播”，同时还有以“联接中外、沟通世界”为使命的英文“AI合成主播”。^[3]

技术原理

建立输入文本与输出音频信息的关联，在图像生成引擎中，使用业界的搜狗人脸识别、三维人脸重建、表情建模等技术对人脸表情动作进行特征学习和建模，建立输入文本、输出音频与输出视觉信息的关联映射，最终生成输出分身视频。^[4]

研发作用

“AI合成主播”使用新华社中、英文主播的真人形象，配合搜狗“分身”的语音、合成等技术模拟真人播报画面。这种播报形式，突破了以往语音图像合成领域中，只能单纯创造虚拟形象，并配合语音输出唇部效果的约束，提高了观众信息获取的真实度。利用“搜狗分身”技术，“AI虚拟主播”还能实时高效地输出音视频合成效果，使用者通过文字键入、语音输入、机器翻译等多种方式输入文本后，将获得实时的播报视频。这种操作方式将减少新闻媒体在后期制作的各项成本，让新闻视频的制作效率有了提高。^[5]

“AI合成主播”拥有和真人主播同样的播报能力，能24小时不间断播报。^[5]

发展动态

2019年2月19日^[6]，搜狗公司与新华社新媒体中心联合发布了首个站立式AI合成主播，新的AI合成主播从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”，标志着“搜狗分身”技术再次取得突破。^[6]

2019年3月，新华社联合搜狗公司近日在京发布全新升级的站立式AI合成主播，并推出全球首个AI合成女主播。^[7]

升级亮点

新版的AI合成主播采用了wavernn波形建模技术，替换掉传统声码器，实现音频合成。通过模型优化及多风格数据的使用，新版的AI合成主播实现了表情合成、肢体动作与语义的匹配。

随着图形生成引擎的优化，AI合成主播从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”，利用“搜狗分身”技术继续赋予AI合成主播肢体语言的能力，让AI合成的主播更智能。

研发意义

“AI合成主播”不仅在全球AI合成领域实现了技术创新和突破，更是在新闻领域开创了实时音视频与AI真人形象合成的先河。“AI合成主播”结合新华社“现场新闻”报道，将“AI合成主播”与短视频一体化生产制作。^[8]

最新推出的站立式AI合成主播即将投入到2019年新华社全国两会的报道筹备中，并将在搜狗搜索、输入法等平台上与用户见面。

随着“搜狗分身”技术能力的不断提高，AI合成主播的定制周期也降低，合成效果和稳定性也有提升。仅靠少量用户真实音视频数据，即可定制出高逼真度的分身模型，帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。^[9]

媒体评论

《

参考消息

》报道

援引外媒报道称，中国的新闻主播可能面临一些新的竞争——人工智能机器人在播报新闻时可以模仿人的面部表情和举止。^[8]

除此之外，《泰晤士报》、福克斯新闻、今日俄罗斯电视台、法兰西24电视台、《新闻周刊》、《洛杉矶时报》、美国国家公共电台等媒体也进行了报道。

《

路透社

》报道

路透社报道称，这个AI主播是以中国新闻主播邱浩为原型的，它身穿黑西装打着领带。这是中国旨在提升其在人工智能技术方面能力努力的一部分。^[8]

《

独立报

》报道

英国《独立报》网站则称，新华社的AI主播是一位栩栩如生的数字化播报员，可以通过模仿真人主播的形象和声音朗读文本内容。

在受到赞许的同时，有些媒体认为“AI合成主播”还需要进一步完善。美国《赫芬顿邮报》网站称，新华社似乎知道AI主播是需要不断完善的，正如AI主播在其首次播报中所强调的那样。它说：“作为一名正在研发中的人工智能新闻主播，我知道我需要改进的还有很多。谢谢。”^[8]

学者的分析

英国谢菲尔德大学人工智能和机器人学荣誉教授诺埃尔·夏基表示，AI主播是一个不错的尝试，今后我们会看到它不断改进。

参考资料

1.王砚峰：AI合成主播基于“搜狗分身”技术 · 新浪（引用日期：2018-11-27）

2.全球首个“AI合成主播”在新华社上岗 · 腾讯（引用日期：2018-11-27）

3.全球首个“AI合成主播”在新华社上岗 · 新华网（引用日期：2018-11-07）

4.“搜狗分身”技术亮相乌镇，“AI合成主播”入职新华社 · 168（引用日期：2018-11-28）

5.全球首个“AI合成主播”在新华社上岗 · 中国网（引用日期：2019-01-07）

AI合成主播相关的文章

智能障碍

智能障碍是一组临床综合征，可有记忆、认知(概括、计算、判断等)、语言、视空间功能和人格等至少3项受损。智能障碍常由神经系统疾病、精神疾病和躯体疾病引起。智能障碍的主要症状包括记忆障碍、认知与判断障碍、人格改变、情感障碍。智能障碍的治疗主要是针对脑部原发病的治疗及康复治疗。智能障碍给患者的正常生活、学

冯淬帆（中国香港演员、导演）

冯淬帆，1945年6月1日在广东省佛山市顺德区出生，中国香港知名影视演员、导演和监制。

环颈雉（鸡形目雉科雉属鸟类）

环颈雉（Phasianus colchicus），别名雉鸡、野鸡、山鸡，雉科雉属鸟类。体长一般为590~870毫米，体重880~1659克。雄鸟体大，羽色随亚种不同而艳丽多变，头侧各具一耳羽簇，面部裸露皮肤呈红色，头颈暗蓝绿色，部分具白色颈圈或仅有痕迹，体羽为斑驳而泛紫光的栗色至金棕色，尾羽长，其上

信徒宫

在伊拉克首都巴格达市中心有座六层高的“信徒宫”，这是当年萨达姆在担任总统期间的办公与生活地点之一。

班超（东汉军事家、外交家）

汉明帝永平五年（62年），班超举家迁往雒阳（今河南洛阳），日常以替人抄书维持家庭生活。永平十六年（73年），班超以假司马的身份跟随奉车都尉窦固前往边塞，后跟随从事郭恂前往西域。他们辗转停留在西域三十多年，联络各国以孤立匈奴，对国家的巩固统一做出突出贡献。永宁七年（95年），班超被朝廷封为定远侯，后人

科幻世界（共5册）

《科幻世界》(英文名：Sci-Fi World，缩写SFW)是科幻世界杂志社出版的科幻类杂志。创刊于1979年，前身是《奇谈》和《科学文艺》，是中国乃至世界发行量最大的科幻小说杂志，曾获得“世界科幻协会最佳期刊奖”、“中国国家期刊奖提名奖”，并入选“中国百种重点社科期刊”、“双奖期刊”，曾承办过1991年世界科幻协会年会，是中国科幻期刊中一面历久弥新的金牌。杨潇，阿来，秦莉曾先后任杂志社社长，其中阿来任社长期间曾以《尘埃落定》获茅盾文学奖。