科大讯飞与中科大联合团队在同声传译任务中包揽三个赛道冠军!
创始人
2025-12-03 21:03:16
0

在2021年国际口语机器翻译评测大赛(简称IWSLT)中,科大讯飞与中国科学技术大学语音与语言信息处理国家工程实验室(USTC-NELSLIP)联合团队荣获三项冠军同声传译任务中的曲目!

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

这有多棒?

让我向您简单介绍一下背景:

作为全球最具影响力的口语机器翻译评测竞赛,IWSLT已经举办了18年,每年都有不同的语音翻译竞赛任务。

今年,IWSLT共设置了4类任务,其中包括同声传译任务。 为了考察不同语言对词序的影响以及语音同声传译的整体表现,本次同声传译任务设置了三个赛道:

并通过“翻译质量”和“翻译延迟”两个维度进行评价。 以下是英德文本同声传译比赛的结果:

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

▲英德文本同声传译结果截图

UEDIN:英国爱丁堡大学

USTC-NESLIP:科大讯飞-中国科大联合团队

APPTEK:AppTek(德国)

VOLCTRANS:字节跳动火山翻译团队

科大讯飞在低、中、高三个延迟区间(注意图中红星的位置)明显优于其他系统,并获得所有赛道的冠军! 尤其是低时延环境下的进展,将进一步推动机器同声传译的商业落地。

三个赛道的详细比赛成绩如下:

科大讯飞语音软件_科大讯飞语音库是免费的吗_科大讯飞语音引擎app

科大讯飞语音引擎app_科大讯飞语音软件_科大讯飞语音库是免费的吗

科大讯飞语音软件_科大讯飞语音库是免费的吗_科大讯飞语音引擎app

▲左右滑动查看结果截图

以下顺序为:英德文本同声传译效果排名、英日文本同声传译效果排名、英德语音同声传译效果排名

我们是怎么做的?

一个关键原因是我们创新性地提出了交叉注意力增强传感器(CAAT)同声传译架构。 基于这个框架,我们可以更好地实现翻译效果和延迟之间的平衡。 模型结构如下:

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

围绕同声传译任务中翻译质量和延迟两个评价目标,借鉴语音识别中的多路径优化方法,共同优化动态决策和翻译效果,从而在延迟和翻译质量之间找到更好的平衡点。 平衡。

这句话怎么理解呢?

举个栗子:

“你好,他想问一下火车站在哪里?”

当机器听这句话的时候,这些就被逐字输入到机器的“脑袋”中。 在输入过程中,机器需要根据自己的模型和策略做出翻译决策。

目前经典的机器翻译技术中,翻译策略通常是在N个单词出现后才开始翻译。

例如固定单词数为2,当机器读到第二个单词“he”时,输出第一个单词“Hello”的翻译结果,即输出“Hello”; 那么每次读到一个单词,就输出一个单词“ask”被读入,然后输出“he”,以此类推。 当机器读取源信息时,会一次性输出所有结果。 该策略同声传译的两个指标是选择固定延迟和优化翻译效果。 它比较机械,很容易造成直译或预测错误,尤其是在延迟较低的情况下。

我们的CAAT模型将根据输入和语义进行全面分析。 当“Hello”出现时,它可以独立分析出“Hello”是一个相对完整的语义。 不管后面是什么词,它的翻译通常是固定的,它会立即决定先翻译“Hello”。 同时,它还会根据语义自主调整顺序,使翻译后的语言更加地道。

科大讯飞语音库是免费的吗_科大讯飞语音引擎app_科大讯飞语音软件

▲具体翻译策略大概如图

与当前主流机器翻译技术相比,CAAT避免了延迟过大或固定延迟带来的翻译质量下降的问题,实现了相同延迟下翻译质量的显着提升。

除了这种模型结构的创新之外,我们还优化了模型融合、数据增强等策略,以解决任务中语音翻译数据有限的问题。

总之,通过我们的创新和努力,我们成为第一个在延迟和翻译质量之间找到更好平衡点的人!

我们的技术用在哪里?

科大讯飞双屏翻译机

在前后屏的支持下,可以呈现同声传译级别的实时翻译效果,让人们在保持社交距离的同时顺畅沟通。 特别是创新开发了对话翻译、录音翻译、语音翻译、同声字幕等功能,可与移动电脑、大屏幕(电视、投影、会场LED等)联动,帮助用户跨界沟通。语言报告工作和提案演讲。 ,在远程会议期间提供实时语音翻译或同声传译字幕。

科大讯飞语音库是免费的吗_科大讯飞语音引擎app_科大讯飞语音软件

科大讯飞同声传译

目前支持中文、英文、日文、韩文、法文、西班牙文、俄文、阿拉伯文八种语言的实时音译,以及中英、日文、韩文、法文、西班牙文、俄文、德文、阿拉伯文的音译。阿拉伯。 翻译。 通过客户端,可以在会议现场或在线会议上实现实时语音识别、翻译和内容录制,并将识别和翻译的内容形成字幕并实时显示在屏幕上。 是一款可广泛应用于大型高端会议、会议、展览等场景的软件产品。

科大讯飞语音库是免费的吗_科大讯飞语音引擎app_科大讯飞语音软件

▲科大讯飞为WAIC2021提供同声传译服务

截至目前,科大讯飞已为超过10000场会议提供同声传译服务。 科大讯飞网站和APP已为近1500万用户提供智能转录和翻译服务,转录总时长超过3866万小时。

科大讯飞语音引擎app_科大讯飞语音库是免费的吗_科大讯飞语音软件

尽管如此,与人工同声传译相比科大讯飞语音软件,机器同声传译也存在着我们无法避免的问题:

机器翻译很容易出现“直译”问题。 同时科大讯飞语音软件,机器翻译在语义理解和核心内容的传达上更容易出现识别和翻译错误等问题。

站在斩获IWSLT 2021语音同传任务三项赛道冠军的基础上,我们将以此次技术突破为新起点,进一步提升科大讯飞在语音翻译和机器同声传译领域的核心竞争力!

为科大讯飞点赞!

相关内容

热门资讯

今... 今日资源:“更多电视”今天要给大家推荐的这款软件绝对是良心之作。 该软件主要是一款电视直播软件。 难...
中... 2014年,CCF推出CSP认证(Certified Software Professional,软...
如... 前言本文主要介绍如何卸载和删除用友软件,包括如何卸载数据库、彻底删除用友系统、删除安装目录。 本教程...
o... 介绍在 LAMBDASCOPE,我们开发了一款可插拔 OTDR XFP 模块,专为这些新的面向实时监...
社... 随着计算机的普及,计算机已经融入到我们的工作和学习中。 学习离不开电脑,工作也离不开电脑。 为了更好...
程... 每当您决定使用哪个软件或平台来完成日常任务时,都有很多选择。 所以,我决定写一个我们开发部门常用的软...
深... 系统深度更新,欢迎大家升级体验!新版本号规则说明从本次版本发布开始,版本号将采用公司统一命名标准,采...
相... · 禁用设置中的登录和 iCloud 登录。 只需从App Store登录并在下载后立即退出即可。·...
打... 小楚(《天方岩谈》作者)即使你没有玩过《王者荣耀》,你也一定听说过它,或者受到过它的影响。 据腾讯官...
(... 大家好,我叫依查。智能硬件是继智能手机之后的一个技术概念。 通过软件和硬件的结合,对传统设备进行改造...
P... 为了提高办公效率,很多人选择同时使用两台电脑。 功能强大的台式电脑可以处理复杂的工作,笔记本电脑可以...
世... Felo Translator(Felo实时翻译)是全球首款采用大语言模型AI技术的同声传译APP。...
一... 朋友们大家好,我是助理姐姐。最近AI绘图的话题特别火。 毕竟,人工智能技术的发展已经超出了我们的想象...
基... 相信大家都遇到过这样的情况:一份PPT已经快完成了,还需要进行最后的修改和收尾工作。 这并不难,但重...
赚... 点击上方“梁子创业笔记”关注公众号赚钱才是硬道理,思考才是价值的可靠体现最近在淘宝和抖音闲逛,发现命...
如... 作者 | 翁庆晓 宁波广播电视集团订阅 | 010-86092062作为一款使用率较高的专业视频编...
A... 大家好,又是和大家分享资源的一天! 作为市场上主流的设计编辑软件,Adobe软件每次更新都会引起很多...
W... 虽然Windows 10中的内置工具也可以进行定时关机等操作,但是设置方法非常麻烦,而这款关机定时器...
天天白银app软件骗人的,高杠...   天天白银APP通过虚构高收益、“白银即将暴涨”“五元起投”“24小时改变账户余额”等夸张承诺吸引...
天天铂银app软件骗人的,高手...   天天铂银APP在抖音、快手、番茄小说等平台宣传:“白银即将暴涨”“五元起投”“24小时改变账户余...