文章插图
正在进行的翻译的结尾倾向于闪烁,因为它更可能依赖于尚未到达的源单词 。我们通过从翻译中截断一些单词直到观察到源句的结尾来减少这种情况 。因此,此屏蔽过程将等待时间换成了稳定性,而不影响质量 。这与在流方法(如Wait-k)中使用的基于延迟的策略非常相似,但仅在推理过程中而不在训练过程中应用 。神经机器翻译常常在同样好的翻译之间“拉锯”,造成不必要的擦除 。我们通过将输出偏向我们已经显示给用户的内容来高稳定性 。除了减少擦除,偏向还可以通过更早地稳定翻译来减少延迟 。偏向与掩蔽很好地相互作用,因为可能不稳定的掩蔽词也可以防止模型偏向它们 。但是,此过程的确需要仔细调整,因为高偏差以及掩蔽不足可能会对质量产生负面影响 。掩蔽和偏置的结合产生了高质量和低延迟的重新翻译系统,同时几乎消除了擦除 。下表显示了指标如何响应我们引入的启发式方法,以及它们如何与上述其他系统进行比较 。该图表明,即使擦除预算很小,重新翻译也超过了专为实时翻译而训练的零闪烁流式翻译系统(MILk和Wait-k) 。
文章插图
在有和没有掩盖和偏见的推理时间稳定启发法的情况下,对IWSLT测试2018 Engish-German(TED演讲)的重新翻译进行评估 。稳定度大大减少了擦除 。由于偏见,以BLEU衡量的翻译质量受到的影响很小 。尽管有掩蔽,但有效延迟仍然保持不变,因为转换会更快地稳定下来 。
文章插图
WMT 14英德文上的重新翻译与稳定化和专用流传输模型(Wait-k和MILk)的比较 。通过偏移和掩蔽的不同组合获得重新翻译的BLEU滞后权衡曲线,同时每10个生成的擦除预算保持少于2个字的擦除预算 。与无法进行更正并需要针对每个折衷点进行专门培训的流模型相比,重新翻译供了更好的BLEU /滞后折衷 。上面概述的解决方案可以非常快速地返回不错的翻译,同时可以随着更多源句的使用而对其进行修订 。简单的重新翻译结构使我们能够以最小的努力来应用我们最好的语音和翻译模型 。但是,减少删除只是故事的一部分-我们也期待通过新技术改善整体语音翻译体验,这种新技术可以减少口译时的延迟,或者可以在多人讲话时供更好的转录效果 。
以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!
「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助:- 专家教你如何用健身器材
- 锻炼时激情低落怎么办?
- 运动器械有哪些呢
- 如何挑选健身器材呢
- 家里运动器材有哪些
- 锻炼器材有哪些呢
- 插座漏电保护器跳闸的原因
- 2021公认十大最稳定路由器 路由器拆解可以做什么
- 锻炼腹肌的健身器材有哪些呢
- 每天走路自动计步器 计步宝走路赚钱是真的吗