科大讯飞与中科大联合团队在同声传译任务中包揽三个赛道冠军!
创始人
2025-12-03 21:03:16
0

在2021年国际口语机器翻译评测大赛(简称IWSLT)中,科大讯飞与中国科学技术大学语音与语言信息处理国家工程实验室(USTC-NELSLIP)联合团队荣获三项冠军同声传译任务中的曲目!

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

这有多棒?

让我向您简单介绍一下背景:

作为全球最具影响力的口语机器翻译评测竞赛,IWSLT已经举办了18年,每年都有不同的语音翻译竞赛任务。

今年,IWSLT共设置了4类任务,其中包括同声传译任务。 为了考察不同语言对词序的影响以及语音同声传译的整体表现,本次同声传译任务设置了三个赛道:

并通过“翻译质量”和“翻译延迟”两个维度进行评价。 以下是英德文本同声传译比赛的结果:

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

▲英德文本同声传译结果截图

UEDIN:英国爱丁堡大学

USTC-NESLIP:科大讯飞-中国科大联合团队

APPTEK:AppTek(德国)

VOLCTRANS:字节跳动火山翻译团队

科大讯飞在低、中、高三个延迟区间(注意图中红星的位置)明显优于其他系统,并获得所有赛道的冠军! 尤其是低时延环境下的进展,将进一步推动机器同声传译的商业落地。

三个赛道的详细比赛成绩如下:

科大讯飞语音软件_科大讯飞语音库是免费的吗_科大讯飞语音引擎app

科大讯飞语音引擎app_科大讯飞语音软件_科大讯飞语音库是免费的吗

科大讯飞语音软件_科大讯飞语音库是免费的吗_科大讯飞语音引擎app

▲左右滑动查看结果截图

以下顺序为:英德文本同声传译效果排名、英日文本同声传译效果排名、英德语音同声传译效果排名

我们是怎么做的?

一个关键原因是我们创新性地提出了交叉注意力增强传感器(CAAT)同声传译架构。 基于这个框架,我们可以更好地实现翻译效果和延迟之间的平衡。 模型结构如下:

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

围绕同声传译任务中翻译质量和延迟两个评价目标,借鉴语音识别中的多路径优化方法,共同优化动态决策和翻译效果,从而在延迟和翻译质量之间找到更好的平衡点。 平衡。

这句话怎么理解呢?

举个栗子:

“你好,他想问一下火车站在哪里?”

当机器听这句话的时候,这些就被逐字输入到机器的“脑袋”中。 在输入过程中,机器需要根据自己的模型和策略做出翻译决策。

目前经典的机器翻译技术中,翻译策略通常是在N个单词出现后才开始翻译。

例如固定单词数为2,当机器读到第二个单词“he”时,输出第一个单词“Hello”的翻译结果,即输出“Hello”; 那么每次读到一个单词,就输出一个单词“ask”被读入,然后输出“he”,以此类推。 当机器读取源信息时,会一次性输出所有结果。 该策略同声传译的两个指标是选择固定延迟和优化翻译效果。 它比较机械,很容易造成直译或预测错误,尤其是在延迟较低的情况下。

我们的CAAT模型将根据输入和语义进行全面分析。 当“Hello”出现时,它可以独立分析出“Hello”是一个相对完整的语义。 不管后面是什么词,它的翻译通常是固定的,它会立即决定先翻译“Hello”。 同时,它还会根据语义自主调整顺序,使翻译后的语言更加地道。

科大讯飞语音库是免费的吗_科大讯飞语音引擎app_科大讯飞语音软件

▲具体翻译策略大概如图

与当前主流机器翻译技术相比,CAAT避免了延迟过大或固定延迟带来的翻译质量下降的问题,实现了相同延迟下翻译质量的显着提升。

除了这种模型结构的创新之外,我们还优化了模型融合、数据增强等策略,以解决任务中语音翻译数据有限的问题。

总之,通过我们的创新和努力,我们成为第一个在延迟和翻译质量之间找到更好平衡点的人!

我们的技术用在哪里?

科大讯飞双屏翻译机

在前后屏的支持下,可以呈现同声传译级别的实时翻译效果,让人们在保持社交距离的同时顺畅沟通。 特别是创新开发了对话翻译、录音翻译、语音翻译、同声字幕等功能,可与移动电脑、大屏幕(电视、投影、会场LED等)联动,帮助用户跨界沟通。语言报告工作和提案演讲。 ,在远程会议期间提供实时语音翻译或同声传译字幕。

科大讯飞语音库是免费的吗_科大讯飞语音引擎app_科大讯飞语音软件

科大讯飞同声传译

目前支持中文、英文、日文、韩文、法文、西班牙文、俄文、阿拉伯文八种语言的实时音译,以及中英、日文、韩文、法文、西班牙文、俄文、德文、阿拉伯文的音译。阿拉伯。 翻译。 通过客户端,可以在会议现场或在线会议上实现实时语音识别、翻译和内容录制,并将识别和翻译的内容形成字幕并实时显示在屏幕上。 是一款可广泛应用于大型高端会议、会议、展览等场景的软件产品。

科大讯飞语音库是免费的吗_科大讯飞语音引擎app_科大讯飞语音软件

▲科大讯飞为WAIC2021提供同声传译服务

截至目前,科大讯飞已为超过10000场会议提供同声传译服务。 科大讯飞网站和APP已为近1500万用户提供智能转录和翻译服务,转录总时长超过3866万小时。

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

尽管如此,与人工同声传译相比科大讯飞语音软件,机器同声传译也存在着我们无法避免的问题:

机器翻译很容易出现“直译”问题。 同时科大讯飞语音软件,机器翻译在语义理解和核心内容的传达上更容易出现识别和翻译错误等问题。

站在斩获IWSLT 2021语音同传任务三项赛道冠军的基础上,我们将以此次技术突破为新起点,进一步提升科大讯飞在语音翻译和机器同声传译领域的核心竞争力!

为科大讯飞点赞!

相关内容

热门资讯

免...                                      一款全能视频格式转换软件 ...
A... 在电子设计中,很多电子工程师会选择Altium Designer(简称:AD)来绘制PCB板,其中之...
飞... 办公软件基本使用Office software basic use当今的时代,是一个科技发展迅速的时...
►... 模具设计实用资料UG软件全套命令教程+模具经典结构视频+57套模具全3D图档总共30G,免费分享!免...
远... 前言喜欢MOD男孩的小伙伴,记得将公众号设为星标⭐,这样每天就可以第一时间获取最新的资源啦。温馨提醒...
便... 现在社区便利店蓬勃发展,很多人选择加盟和经营便利店。 对于门店管理来说,选择便利店收银系统是必须的。...
微... 点击笔记软件右上角,选择“分享”给朋友或群组如何再次打开如果您已经打开了手机版抄本软件,想再次打开,...
云... 1、首先我们在浏览器中打开云展网,进入云展网首页,点击登录/注册,可以选择微信、QQ登录,也可以一键...
创... 创建自己的应用程序可能看起来很复杂,但实际上只需要几个简单的步骤。这是一个简单的教程,帮助您创建自己...
企... 企业内部杂志是企业文化的载体,是企业文化的外在表现。 也是企业信息传递的沟通渠道和舆论宣传阵地。企业...
应... 过去,App开发往往由专业技术人员进行。 懂技术的人不懂市场实际业务,懂业务的人不懂技术。 这会产生...
十... 选课即将开放同学们请就座适当的人才教育敖小学的强化课程多样、特色鲜明。 四、五年级的学生可以根据自己...
十... 01课程介绍有些人可能认为十字绣布上只能绣十字绣。 事实上,情况并非如此。 由于十字绣布具有清晰的经...
盘... 我的习惯前言:绘画有很长的时间线。 从原始时期的壁画,到陶瓷上的绘画,再到纸上的绘画,我们基本上可以...
2... 关于公布“辰溪工程计价软件”等3套合格计价软件名单(第一批)的通知民建办[2017]8号各区、市建设...
2... 2023冬季考级下载准考证方式以下专场的考生请联系所属书院老师确定具体考试时间,提前下载准考证,结合...
招... 招商银行近期受到互联网金融平台负面影响。 广东钱短商务服务有限公司(以下简称“钱短”)的用户在多个平...
全... 全网VIP视频免费看,高清无广告,再也不用充值会员啦!APP下载地址:http://xiaodong...
免... 元吉笔记将向大家介绍一款强大的下载工具——幻影磁力下载器。这款软件功能强大,它不仅支持迅雷下载,还可...
C... 淘宝联盟是淘宝网旗下的推广平台,主要为商家提供产品推广和销售渠道。 加入淘宝联盟可以帮助商家增加产品...