有机器翻译还用学外语吗

16.07.2014  11:44

如果考虑语言的出处和文化差异,则不能指望机器取代人工翻译稿件

机器翻译出错闹笑话的段子数不胜数,但大数据的应用却令这种技术手段日趋完善。甚至有支持者认为,机器翻译终将取代人力,让人类克服语言障碍交流。然而,技术真能参透人类语言的丰富和微妙之处吗?

大数据优势

初级机器翻译更像一部电子词典,擅长翻译单个字词和简单句子,但对多义词却束手无策。正因如此,尽管发展多年,纯粹的机器翻译仍然错漏百出。大数据时代的来临,可能彻底改写这种局面。

如今的机器翻译系统依据统计学原理工作。通常,设计者向机器翻译系统录入优质人工翻译文本。比对源语言和目标语言文本之后,系统能够自动识别,某种语言中的X在另一种语言中是Y。结合上下文,机器翻译系统还能识别在何种语境之下,X应该翻译成Z,而不是Y。

牛津大学研究机器翻译的专家菲尔·布隆索姆因此认为,机器翻译就是猜。“电脑其实根本不懂这门语言或任何语法,只不过依据统计学原理确定,应该是‘一条狗’而非‘狗一条’。”他说。

这意味着,输入的文本资料越多,机器翻译的准确率越高。“各门语言的情况不一样,建立一个机器翻译模式,通常需要3000万单词或者100多万个句子。”布隆索姆说。多亏有联合国和欧盟这样的机构存在,其翻译人员历经多年积累起丰富的平行语料库(也称翻译记忆库),为机器翻译研发人员省去不少麻烦。

技术局限

随着电脑运行更快、储存设备更便宜、翻译软件更智能,机器翻译的热爱者忍不住憧憬:会不会有那么一天,人们将彻底告别学习外语的苦恼,借助机器翻译,实现跨越语言障碍的自由交流?

对于主要居住在国内、只和本国人打交道的多数人而言,机器翻译会是一个不错的选择。随着技术完善,机器翻译将更为准确可靠,足够偶尔使用外语的人使用。

然而,人类语言如此复杂、微妙,远非平行语料库能够囊括。“如果涉及比喻或者任何诗意的语言,就非常困难,”牛津大学学者布隆索姆说,“如果用到一个翻译系统从未见过的双关语,电脑只会字面直译。

如果考虑各种语言的出处和文化差异,有些字词无法翻译,即所谓的不可译性现象,则根本不能指望机器翻译取代人工翻译。

(新华社7月15日电)

 

 

编辑: 王仲平