1.机器口译的基本概念
相对于机器翻译,机器口译是一个相对陌生的概念。机器口译(MI),又称“口语翻译”(Spoken Language Translation,SLT)、“语音机器翻译”(Speech-to-Speech MT)或“自动口译”(AutomatedInterpretation),是指让计算机实现从一种语言的语音到另一种语言的语音自动翻译的过程(瑞诺尔, 2010)。其理想目标是让计算机像人一样在持不同语言的说话人之间充当口译员的角色。会议演讲、交谈(通过电话、网络或面对面交流)、广播等场景下的话语翻译都是机器口译应用的重要领域。
机器口译可分解为三个步骤:一是语音识别,即机器通过软件接收说话人的语音,然后将其识别转化为文字;二是语言转换,即机器翻译程序对文本进行加工转译;三是语音合成,即机器将译文自动形成目的语语音输出。因此,机器口译包含三项核心技术:语音识别、机器翻译和语音合成。
与机器翻译一样,人们常把机器口译与计算机辅助口译(CAI)或“机助口译”混为一谈。机器口译是全自动口译,无需人工辅助,例如各种在线语音翻译系统、口语翻译机、口译机器人、自动口译电话等。计算机辅助口译则指译员在计算机的辅助之下完成口译任务。计算机辅助口译的原理是:计算机快速识别源语语音,然后将识别的内容进行机器翻译,最后将译文呈现在屏幕上,供译员参考。不难看出,最后的译文是显示在屏幕上供译员参考还是转换成语音由机器播出,这是机器口译与计算机辅助口译的根本区别之所在。
2. 机器口译的优缺点
机器口译有着人工口译难以企及的一系列优点:
一是成本低。人工口译培养周期长、难度大、费用高,特别是同传,国际会议上每个语种往往需要安排两名译员,人力和开支要求均比较高;机器口译使用成本低,有的甚至完全免费。
二是效率高。人工口译费时、费事、效率低下,还时常出现翻译盲点,且译员受体力、脑力和能力的限制,难以长时间、不间断、高强度地工作,特别是同传;机器口译速度快、效率高,不会疲劳,且受海量数据支持,学习快,无翻译盲点,可以大大提高翻译效率和同传准确性。
三是使用方便。人工口译难找,特别是非通用语种;机器口译不受语种和时空的限制,一个系统可同时安装几种、几十种甚至几百种语言互译,因而方便、快捷、省事,尤其是准确性要求不高的口译。此外,国际会议上同传设备使用麻烦,同传接收机经常不够用,且容易丢失,引发纠纷;机器口译相对简便,只需在智能手机或平板电脑上安装一个应用软件即可收听同传或者进行交谈。
当然,机器口译也存在着一系列缺点,主要瓶颈有两个:
一是语音识别软件尚不完美。语音识别的准确性与说话人的口语质量和周围环境密切相关。目前,多数语音翻译系统和应用软件只能识别语速不快、发音规范、前后连贯的语句。假如说话人语速很快,讲话不连贯,或者讲方言、带口音、吐字不清、发音错误、使用同音字,语音识别系统就会出错。同时,环境噪声(背景噪声、背景语音、混响、回声、多人讲话)、信道噪声(麦克风调整、电话调整、电话蜂音)、网络连接不畅、说话人距离远,都会严重降低语音识别的准确率。
二是机器翻译不够准确。机器算法无法理解和翻译语言文学性,包括文化、语境、语法和情感。人类语言非常复杂,许多词语是多义的,具体意思取决于特定的语境。机器翻译常常忽略上下文来翻译词句,也不遵守语法,因而译文生硬,常常伴有语法和语序错误,准确性和流畅性较差。目前,机器翻译还基本停留在表层结构的句法分析之上,无法像人脑一样理解意义、区分情感色彩和文化差异,因而无法识别和传达语言的深层含义、言外之意和文化元素(包括幽默和隐喻)。