科大讯飞与中科大联合团队在同声传译任务中包揽三个赛道冠军!
创始人
2025-12-03 21:03:16
0

在2021年国际口语机器翻译评测大赛(简称IWSLT)中,科大讯飞与中国科学技术大学语音与语言信息处理国家工程实验室(USTC-NELSLIP)联合团队荣获三项冠军同声传译任务中的曲目!

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

这有多棒?

让我向您简单介绍一下背景:

作为全球最具影响力的口语机器翻译评测竞赛,IWSLT已经举办了18年,每年都有不同的语音翻译竞赛任务。

今年,IWSLT共设置了4类任务,其中包括同声传译任务。 为了考察不同语言对词序的影响以及语音同声传译的整体表现,本次同声传译任务设置了三个赛道:

并通过“翻译质量”和“翻译延迟”两个维度进行评价。 以下是英德文本同声传译比赛的结果:

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

▲英德文本同声传译结果截图

UEDIN:英国爱丁堡大学

USTC-NESLIP:科大讯飞-中国科大联合团队

APPTEK:AppTek(德国)

VOLCTRANS:字节跳动火山翻译团队

科大讯飞在低、中、高三个延迟区间(注意图中红星的位置)明显优于其他系统,并获得所有赛道的冠军! 尤其是低时延环境下的进展,将进一步推动机器同声传译的商业落地。

三个赛道的详细比赛成绩如下:

科大讯飞语音软件_科大讯飞语音库是免费的吗_科大讯飞语音引擎app

科大讯飞语音引擎app_科大讯飞语音软件_科大讯飞语音库是免费的吗

科大讯飞语音软件_科大讯飞语音库是免费的吗_科大讯飞语音引擎app

▲左右滑动查看结果截图

以下顺序为:英德文本同声传译效果排名、英日文本同声传译效果排名、英德语音同声传译效果排名

我们是怎么做的?

一个关键原因是我们创新性地提出了交叉注意力增强传感器(CAAT)同声传译架构。 基于这个框架,我们可以更好地实现翻译效果和延迟之间的平衡。 模型结构如下:

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

围绕同声传译任务中翻译质量和延迟两个评价目标,借鉴语音识别中的多路径优化方法,共同优化动态决策和翻译效果,从而在延迟和翻译质量之间找到更好的平衡点。 平衡。

这句话怎么理解呢?

举个栗子:

“你好,他想问一下火车站在哪里?”

当机器听这句话的时候,这些就被逐字输入到机器的“脑袋”中。 在输入过程中,机器需要根据自己的模型和策略做出翻译决策。

目前经典的机器翻译技术中,翻译策略通常是在N个单词出现后才开始翻译。

例如固定单词数为2,当机器读到第二个单词“he”时,输出第一个单词“Hello”的翻译结果,即输出“Hello”; 那么每次读到一个单词,就输出一个单词“ask”被读入,然后输出“he”,以此类推。 当机器读取源信息时,会一次性输出所有结果。 该策略同声传译的两个指标是选择固定延迟和优化翻译效果。 它比较机械,很容易造成直译或预测错误,尤其是在延迟较低的情况下。

我们的CAAT模型将根据输入和语义进行全面分析。 当“Hello”出现时,它可以独立分析出“Hello”是一个相对完整的语义。 不管后面是什么词,它的翻译通常是固定的,它会立即决定先翻译“Hello”。 同时,它还会根据语义自主调整顺序,使翻译后的语言更加地道。

科大讯飞语音库是免费的吗_科大讯飞语音引擎app_科大讯飞语音软件

▲具体翻译策略大概如图

与当前主流机器翻译技术相比,CAAT避免了延迟过大或固定延迟带来的翻译质量下降的问题,实现了相同延迟下翻译质量的显着提升。

除了这种模型结构的创新之外,我们还优化了模型融合、数据增强等策略,以解决任务中语音翻译数据有限的问题。

总之,通过我们的创新和努力,我们成为第一个在延迟和翻译质量之间找到更好平衡点的人!

我们的技术用在哪里?

科大讯飞双屏翻译机

在前后屏的支持下,可以呈现同声传译级别的实时翻译效果,让人们在保持社交距离的同时顺畅沟通。 特别是创新开发了对话翻译、录音翻译、语音翻译、同声字幕等功能,可与移动电脑、大屏幕(电视、投影、会场LED等)联动,帮助用户跨界沟通。语言报告工作和提案演讲。 ,在远程会议期间提供实时语音翻译或同声传译字幕。

科大讯飞语音库是免费的吗_科大讯飞语音引擎app_科大讯飞语音软件

科大讯飞同声传译

目前支持中文、英文、日文、韩文、法文、西班牙文、俄文、阿拉伯文八种语言的实时音译,以及中英、日文、韩文、法文、西班牙文、俄文、德文、阿拉伯文的音译。阿拉伯。 翻译。 通过客户端,可以在会议现场或在线会议上实现实时语音识别、翻译和内容录制,并将识别和翻译的内容形成字幕并实时显示在屏幕上。 是一款可广泛应用于大型高端会议、会议、展览等场景的软件产品。

科大讯飞语音库是免费的吗_科大讯飞语音引擎app_科大讯飞语音软件

▲科大讯飞为WAIC2021提供同声传译服务

截至目前,科大讯飞已为超过10000场会议提供同声传译服务。 科大讯飞网站和APP已为近1500万用户提供智能转录和翻译服务,转录总时长超过3866万小时。

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

尽管如此,与人工同声传译相比科大讯飞语音软件,机器同声传译也存在着我们无法避免的问题:

机器翻译很容易出现“直译”问题。 同时科大讯飞语音软件,机器翻译在语义理解和核心内容的传达上更容易出现识别和翻译错误等问题。

站在斩获IWSLT 2021语音同传任务三项赛道冠军的基础上,我们将以此次技术突破为新起点,进一步提升科大讯飞在语音翻译和机器同声传译领域的核心竞争力!

为科大讯飞点赞!

相关内容

热门资讯

全... 华为开发者大会第二天,东莞今天真是太热了!然而pc预测软件幸运28,全球首款华为鸿蒙操作系统终端——...
如... 文本01软件介绍在当今的数字时代,手机已经成为我们生活中不可或缺的一部分。 然而,有时不幸的事情会发...
新... 很多人都是盲目加人,加附近的人,在贴吧上发帖。 有的甚至花了不少钱去宣传,但最后,最后还是增加了一两...
微... 在这个流量为王的互联网时代,粉丝争夺战愈演愈烈。 互联网的出现和发展潜移默化地改变了人们的工作和生活...
谁... 如今,手机是每个人手中最常见的工具,手机中的所有程序也非常强大。 可以算是一个小型的移动办公工具。 ...
勒... 2024年2月6日,2023年对于勒索软件组织来说是重要的一年,尽管世界各地的执法部门都在继续打击攻...
专... 2024湖南单招备考长按识别添加陈老师微信18670658307(陈老师)免费领取2024考试复习资...
计... 2024年2月7日,现代化、开源的Linux服务器运维管理面板1Panel正式发布v1.9.6版本。...
国... ​开发一款工业软件,或许很难。开发一款中小学生用的数学软件,前期会容易但是后期会比工业软件更难。(不...
常... 十大设计软件最新安装包,某宝卖19.9,这里只需要9.9元最新版软件中加入了很多强大的功能。工欲善其...
文... 文华财经期货指标公式博易大师软件指标期货多空趋势指标源码风险提示:本指标公式仅作为知识分享,不构成任...
一... 寒假来了,学生党还有在家的人越来越多,我们不如在手机上做任务赚点佣金,平时补贴手机话费这些还是不错的...
软... 本节目录一、软件无线电的射频前端结构1、多次变频的超外差结构2、直接变换的零中频结构3、不变频结构二...
资... Hi大家好,我是子墨,除了每天给大家分享副业搞钱小项目和免费资源!持续好多天分享了,资源涵盖了教程、...
又... 软件名称:老bai故事支持设备:安卓测试设备:小米1101软件介绍今天给大家带来一款好用的免费听书的...
答... 在上一期问答活动中我们得到了许多热情参与者的回答!今天,我们将公布答案并宣布幸运儿,这位幸运儿将获得...
苹... 资源已更新
一... END买管家婆软件找阜阳联泰管家婆软件咨询热线:18205587171 售后电话:0558-2209...
周... 大家好,我是“小周同学”,专注于分享高效的软硬件工具,提高大家的生活效率。周末到了,怎么忍心追剧、看...