“让沟通无障碍”——漫谈机器翻译技术发展史

17.06.2015  18:42

  全球无障碍沟通的时代似乎即将来临。

  不久前,一个实时翻译视频风靡网络,视频中两名分别说着英语和西班牙语的人借助skype软件的实时翻译功能竟然实现了无障碍交流。

  这种之前只在科幻片中存在的场景如今已成现实,而这一切都得益于机器翻译技术。

  机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然语言转变为另一种自然语言的过程。

  在现在看来,机器翻译毫无疑问是一项被公认为具备广泛应用前景的技术方向,但纵观该技术的发展史却并非一帆风顺,其可行性和实用性曾不断遭受质疑。

  下面就让我们一起回顾机器翻译这项曾被视为天方夜谭的技术如何实现“从无到有”,又有哪些前辈大牛们为它的进步做出过不可磨灭的贡献。

  【草创】

  机器翻译的研究历史最早可以追溯到二十世纪三四十年代。

  二十世纪三十年代初,法国科学家G.B。阿尔楚尼提出了用机器来进行翻译的想法。

  1946年,世界上第一台现代电子计算机ENIAC诞生。随后不久,信息论的先驱、美国科学家Warren Weaver于1947年提出了利用计算机进行语言自动翻译的想法。1949年,Warren Weaver发表《翻译备忘录》,正式提出机器翻译的思想。

(图:Warren Weaver)

  【萌芽】

  1954年,美国乔治敦大学在IBM公司协同下,用IBM-701计算机首次完成了英俄机器翻译试验,向公众和科学界展示了机器翻译的可行性,从而拉开了机器翻译研究的序幕。

  (图:IBM-701计算机的英俄翻译)

  随后十年左右的时间内,机器翻译研究热度不断上升。美国、前苏联及一些欧洲国家均对机器翻译研究给予了相当大的重视,机器翻译一时出现热潮。

  【沉寂】

  然而,正当一切有序推进之时,尚在萌芽中的“机器翻译”研究却遭受当头一棒。

  1964年,美国科学院成立了语言自动处理咨询委员会(Automatic Language Processing Advisory Committee)。委员会经过2年的研究,于1966年公布了一份名为《语言与机器》的报告。

(图:《语言与机器》报告)

  该报告全面否定了机器翻译的可行性,并宣称“在近期或可以预见的未来,开发出实用的机器翻译系统是没有指望的”。受此报告影响,各类机器翻译项目锐减,机器翻译的研究出现了空前的萧条。

  【复苏】

  进入二十世纪七十年代中后期,随着计算机技术和语言学的发展以及社会信息服务的需求,机器翻译才开始复苏并日渐繁荣。业界研发出了多种翻译系统,例如 Weinder、EURPOTRAA、TAUM-METEO等。

  其中于1976年由加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发的TAUM-METEO系统,是机器翻译发展史上的一个里程碑,标志着机器翻译由复苏走向繁荣。

  【发展】

  1993年IBM的Brown和Della Pietra等人提出的基于词对齐的翻译模型。标志着现代统计机器翻译方法的诞生。

  2003年爱丁堡大学的Koehn提出短语翻译模型,使机器翻译效果显著提升,借助同时期Franz Och提出的对数线性模型及其权重训练方法,短语翻译模型在工业界开始广泛采用。

(图:Franz Och,曾担任谷歌翻译负责人。)

  2005年David Chang进一步提出了层次短语模型,同时还有多个大学和研究所在基于语法树的翻译模型方面研究也取得了长足的进步。

  【繁荣】

  正是因为一代代科学家们不懈的努力,才让科幻一步步照进现实。

  2011年开始,伴随着语音识别、机器翻译技术的快速发展和经济全球化的需求,口语自动翻译研究成为当今信息处理领域新的研究热点。

  Google、Microsoft纷纷推出自己的新一代智能语音翻译产品,本文开头提到的聊天软件skype中使用的就是微软的机器翻译技术。

  而在这一轮的国际竞争中,国内的企业亦迎头赶上。在2014年的国际口语机器翻译评测比赛(International Workshop on Spoken Language Translation)中,首次参赛的科大讯飞即在中英和英中两个机器翻译方向中以显著优势勇获第一,标志着我国的机器翻译技术取得国际先进水平。