体现“科技奥运会”理念的“冬奥会手语广播数字人”系统将在全国范围内推广。这项技术为冬奥会期间全国聋人提供了精准、自然、流畅的实时手语翻译服务,解决了电视栏目不能完全覆盖听障人群和手语翻译人员不足的问题。
据悉,这项技术得到了北京市科委科技冬奥会的支持,智谱AI、凌云光与北京广播电视台联合打造,实现了北京冬奥会体育新闻节目的实时手语翻译广播,并于2月5日起在北京卫视节目中成功试用。
“数字人”技术具有强大的技术应用能力,将在全国范围内推广。
2月9日,北京市科委在北京智谱华章科技有限公司(以下简称“智谱AI”)举办了“科技冬奥会企业之行”大型主题系列采访活动,参与创建改应用项目的智谱AI副总裁左家平、凌云光科技有限公司副总裁杨艺向中国工业报证实,“冬奥会手语广播数字人”系统将在全国范围内进行公益推广,惠及众多听障人士,可先应用于各电视台、网络平台、大屏幕等多媒体渠道。
北京冬奥会于2022年正式开幕,既是体育节,也是科技赋能的“智慧”节。北京电视台新闻中心副主任王毅在活动现场表示,“冬奥会手语广播数字人”技术表现出强大的科技应用能力,既有公益推广价值,又有商业应用价值。它具有很大的综合社会价值,希望得到推广和使用。
科技赋能奥运会,惠及2700万残疾听障人员
随着人工智能技术的快速发展和应用,它正在成为推动人类进入智能时代的决定性力量。作为推动AI研究从单一模型向多场景同用模型范式转变的关键技术,超大型智能模型在2021年继续成为国际AI前沿研究和应用的热点。与此同时,随着新时期消费者对虚拟内容和服务的需求不断增加,以及元宇宙概念的全球兴起,虚拟现实和人工智能技术也成为全球关注的焦点。
据智谱AI副总裁左家平介绍,根据中国第二次残疾人统计调查数据,中国有2700多万残疾听力障碍者。这次冬奥会是中国历史上第一次举办冬奥会,听力障碍者也期待对比赛信息有更深入的了解。“冬奥会手语广播数字人”的科技赋能方式,让他们更全面地感受到这场精彩优秀的奥运会。
集体智慧构建最大的多模式手语语料库
左家平介绍,“冬奥会手语广播数字人”得到了北京市科委、中关村管委会等单位的支持,由智谱AI支持。、由凌云光和北京广播电视台联合打造,清华大学贾伽教授团队和中国科学院计算研究所陈益强研究员团队也参与了相关关键技术的研发,得到了北京市残联和市残联聋人协会的帮助和支持。该系统以超大规模预训练模型为关键技术,独立构建多模态肢体动作、表情、手指同步采集系统,利用跨模态拟人生成算法、极高精度现实数字人等行业领先技术,实现冬奥会期间专业手语翻译广播比赛。
2018年,《国家通用手语常用词表》和《国家通用盲文方案》作为语言文字规范正式发布。为了推广和普及国家通用手语,《冬奥会手语广播数字人》系统完成了《国家通用手语词典》收集和录制的8214种通用手语,语法以听障人群习惯玩法为准,保证了手语广播成果的准确性和专业性,更好地为听障人群服务。
由于目前国内缺乏完善的手语材料数据,在北京残联和市残联聋人协会的支持下,研发人员邀请了40多名聋人教师和手语专家进行手语文本转写和技术指导,并对听障人群进行了大规模评估。最后,他们建立了中国最大的多模态手语材料库,符合国家通用手语标准,总词汇和句子规模超过10万。
超大规模预训练打造“智能数字大脑”,实现高自然手语动作姿势。
中国工业报从项目开发人员的数据中了解到,为了构建一个能够理解和翻译语音和手语的智能数字大脑,“冬奥手语广播数字人”系统以超大规模的预训练模型为关键技术,通过语义蒸馏和手语翻译快速编制模型,将新闻广播中的语音蒸馏成语义高度接近的手语,并将其翻译成符合手语习惯的语序。最后,手语数字大脑可以通过计算机模仿听障人士的大脑来驱动手语广播。
为了实现高精度、高自然性的人物形象和手语动作姿势,R&D部门还建立了多模态肢体动作、表情和手指同步采集系统。通过采集多模态动作捕捉数据,利用跨模态拟人生成算法,自然流畅地驱动和渲染超现实数字人群,完成文本内容的手语广播。其中,面部采集是通过肌肉绑定技术驱动实现的,结合行业领先的语音识别和超清晰视频生成技术,向听障人群展示了亲近自然的冬奥会手语广播服务。
多模态动作捕捉数据收集现场
应用前景广阔,使科技温度更高
据活动组织者现场介绍,手语广播中数字人的应用场景比较常见。一方面可以为新闻媒体提供全流程智能数字人手语生成服务,方便听障人士快速了解新闻简讯;另一方面,声音广播的内容可以转化为手语,为听障人士广播冬奥会赛事和赛场成绩,方便获取即时信息。
冬奥会开幕后,“冬奥会手语广播数字人”每天继续在北京卫视“北京你早”节目中用手语广播“冬奥会合集”和“一起看冬奥会”,不仅为听障人士提供手语信息广播服务,降低冬奥会运营成本,还方便听障人士观看比赛专题报道,提高社会参与度和幸福感。此外,手语广播数字人的推广可以加快国家通用手语的推广,推动国家通用手语标准的普及,为残疾人平等参与社会生活创造一个无障碍的环境,让科技更有温度。更重要的是,这本书体现了尊重北京的城市。
智谱AICTO张鹏表示:“冬奥会手语广播数字人的应用,展现了企业‘让机器像人一样思考’的愿景。听障人士不仅可以快速获取冬奥会的信息,还可以将无障碍环境的概念传递给数亿人。智谱AI将继续深化数据与知识融为一体的战略,打造强大通用的人工智能系统,通过创新帮助中国人工智能生态建设,让技术带来更多价值。”
【新闻链接:智谱AI】
北京智谱华章科技有限公司于2021年12月2日当选北京市第七批“专精特新”中小企业名单。
智谱AI作为国家高新技术企业,依托清华大学团队十余年的知识智能技术积累,汇聚了一批有激情的AI有志之士,努力打造下一代人工智能系统,数据与知识融为一体,实现“让机器像人一样思考”的愿景,推动第三代人工智能的浪潮。
智谱AI参与开发了超大规模的预训练模型“悟道”,构建了高精度的通用知识地图,开发了中国最大的科技情报分析和挖掘平台AMiner,让人工智能了解科学,预测科技发展趋势和人才发展。基于“数据”和“知识”的虚拟数字大脑,结合人工智能技术和人类认知模式,智谱AI将大规模预训练模型和知识地图有机融合,使虚拟数字人可以不断学习、推理和抽象。研发应用包括科普数字人科技、冬奥会手语广播数字人等。相关技术领域,北进教育和知识产品。
未经数字化报网授权,严禁转载或镜像,违者必究。
特别提醒:如内容、图片、视频出现侵权问题,请发送邮箱:tousu_ts@sina.com。
风险提示:数字化报网呈现的所有信息仅作为学习分享,不构成投资建议,一切投资操作信息不能作为投资依据。本网站所报道的文章资料、图片、数据等信息来源于互联网,仅供参考使用,相关侵权责任由信息来源第三方承担。
Copyright © 2013-2023 数字化报(数字化报商业报告)
数字化报并非新闻媒体,不提供新闻信息服务,提供商业信息服务
浙ICP备2023000407号数字化报网(杭州)信息科技有限公司 版权所有浙公网安备 33012702000464号