机器翻译(MT)到底有多好?按照微软的说法,很好。

本月早些时候,这项技术公司宣布已经创建了一个机器翻译系统,该系统在将中文翻译成英文时已经达到了“人类同等水平”。换句话说,就是说系统完成了翻译,就像人类的语言学家一样。

微软表示,翻译是使用newstest2017创建的一组新闻文章完成的。

微软聘请翻译人员分析结果,并将机器翻译系统的输出与人类语言学家的输出进行比较。在他们的博客上,微软工程师称赞了这一成就,称这是他们一段时间以来的“梦想”。

然而公司指出尽管该系统是成功的,但机器翻译并不是一个“已解决的问题”。值得注意的是,中文和英文都有大量关于话语的数据,微软称新闻报道为“普通”词汇。"

神经MT系统训练的数据越多,翻译的就越好,因为这将有助于以更准确的方式调整神经网络的权重。

一大步;复杂的问题。

微软团队使用人工智能(AI)来帮助翻译新闻片段,并使用双重学习、复习网络和联合训练的方法来完成实验。

这一成果的消息在全球范围内得到了反映,这表明了翻译技术的又一步。近十年来围绕MT的讨论达到了顶峰,业内人士纷纷猜测这项技术的真正潜力。

当神经机器翻译(NMT)达到人工翻译的熟练程度时,最大的问题之一仍然存在。微软指出,由于工作本身的复杂性,很难衡量MT的准确性。

“机器翻译比纯粹的模式识别复杂得多,”微软研究员周明说。公司博客上说。“人们可以用不同的词来表达完全相同的事情,但你可能无法说出哪一个更好。”

语境问题

我们之前讨论过关于人类和机器的争论。至此,人类语言学家具备了批判性思考和理解词语细微差异的能力;人类语言学家也能够更好地应对语言进化,并提供文化差异,以反映更有效的品牌或信息。

ULG新兴语言技术总监胡安·阿隆索对微软的声明表示怀疑,称这一壮举可能被夸大了。

“虽然微软的成就确实令人印象深刻,但‘人类平等’的理念是显而易见的。优秀的人工翻译不会逐句翻译文本;”他们关注整个文本,并利用整个背景产生足够的翻译,”阿隆索说。

“这是微软的MT系统和其他任何MT系统都做不到的。”

然而,正如我们过去所述,MT不完美并不意味着它对特定的内容类型无效。

微软表示新MT系统实现“人类平等”

阿隆索表示,虽然微软提到的技术,如双重训练和审查网络都是很好的技术,但它们并没有为类似人类的准确性铺平道路。

他说:“尽管它们有助于获得非常好的翻译结果,但‘人类平等’的目标并不是迫在眉睫的。”