“你好,欢迎来到对答如流,两会‘智’通车。”一位面带微笑的女主播在屏幕中向用户打着招呼,但是,这位主播并不是真人,而是AI主播“小智”。“小智”主持的两会“智”通车,是一款由百度智能云和央视网在两会期间联合打造的全国首个集智能对话、语音交互、社交分享于一体的时事AI产品。 5月21日起,全国正式进入两会时间。为了向公众普及两会知识,百度智能云携手央视网共同推出了两会“智”通车,依托百度成熟的人工智能技术,以AI主播发问的形式带领参与者回答问题,了解国事,近期获得了网友们高涨的参与热情和一致好评。 如果仔细观察“小智”的细节,我们会发现,她的动作与神态和真人如出一辙,讲话的过程中微笑、自然眨眼等各种面部表情十分逼真。同时“小智”的口型和讲话内容实现了真实的贴合,面对不同的答案也有着不同的交流反应。在这样一位AI主播的带领下,参与者可在两会期间每天享受“智”通车的线上答题乐趣。这种愉悦的体验背后,是百度智能云的强大技术加持,让“小智”集人像美、善交流、懂说话三大亮点于一身。 人像美 这次挑起大梁的“小智”外形来自于百度设计的3D高精度仿真人像,对话时真实感与科技感兼备。结合AI和计算机图形学自主研发的超写实、高精度3D数字员工驱动方案,支持合成语音输入,生成音唇精准同步、表情丰富逼真的人像动画,具有高泛化、低延迟的特点,并且支持表情风格和肢体动作的定制化。 百度虚拟数字人基于真人录像,机器学习人的说话声音、唇动/表情/动作规律,对人像的形态和声音分别进行复制与合成;塑造3D高仿真人像,模拟人脸肌肉组织,以算法驱动人像模型的唇形、表情和动作。支持3D效果,全方位、多角度呈现,面部细节更细腻,展示更多细节;更具艺术性,能够对形象进行艺术设计。 善交流 “小智”在与人沟通时,反应灵敏,对话顺畅,这基于百度强大的语音识别及语音合成能力。百度ASR(自动语音识别技术)采用先进的截断注意力模型(SMLTA),摒弃市场上传统的Attention基于整句的服务,使用语音流进行截断实现完整流畅的交互,提升相对字准率15%,计算速度与传统CTC技术持平。百度TTS(从文本到语音)运用先进的Wavenet深度学习神经网络算法将文字合成为多种语言的不同语音。 随时发问,随时打断,“小智”会说也会听。内置的百度语音处理方案,具备超强抗干扰能力。 懂“说话” 信息太多记不住,“小智”帮你抓重点。百度自研的动态标记语言能够灵活配置多媒体信息展示,还能到点提醒你:“关键词命中率50%,加油!” 简单点,说话的方式简单点。“小智”直观的信息展示,让信息传递效率大幅提升,知识获取更加高效简单,让多位网友直呼“要是我小时候有小智这样的同学一起学习就好了!” 当前,央视网正按照中央广播电视总台“5G+4K/8K+AI”战略布局,持续加大人工智能、5G等新技术的研究与应用,从基础设施层面到AI中台统一建设,打造出技术领先、安全可靠的智能新媒体平台,创新媒体表达和传播方式,开发全场景智能化产品和服务,壮大主流舆论阵地。央视网此次与百度智能云开放合作,通过拥抱新技术,做“5G+4K+AI”全媒体应用的践行者,为全国观众提供更多的优质内容和智能化场景服务,增强主流新媒体的传播力、引导力、影响力、公信力。 5G时代下,较低的带宽传递信息,较高的带宽传递情感。消费级人工智能产品的落地,需要打通人与机器之间的情感隔阂。“小智”的出现也在不断印证着AI时代人机交互新方式的可能性。两会“智”通车之后,央视网还会有更多有趣的智能化交互新产品呈现在大家眼前。百度智能云与央视网的合作,将在媒体行业产生强大的示范效应,加速AI技术在新媒体领域的落地应用。(编辑 张伟)