英译汉机器翻译在多类型文本上的表现、解决方案与启示

姚庆宏 刘效瑄 刘冲 赖立伟 夏凯祥 潘正芹

(桂林电子科技大学,广西 桂林 541004)

使用软件翻译俗称机器翻译,机器翻译随着各种翻译软件的研发如今普及程度高,成为翻译从业者必备的技能,高校的MTI(翻译硕士)专业也把其列为必修课程,相关开发商也在想方设法说服高校将其推广到本科英语教学当中。当机器翻译成为时代潮流,无论从业者还是翻译研究者开始思考机器翻译的效能和可靠性,其中包括探讨和研究机器翻译中还存在的更具体的问题。例如,张威、明昊(2021)[1]通过研究人工翻译、译后编辑、机器翻译的结果对比,发现人工翻译与译后编辑的质量对比取决于机器翻译译文,在原文有一定难度且机器翻译译文质量不高的情况下,人工翻译译文质量高于译后编辑;
在机器翻译译文错误容易识别且整体质量较高时,译后编辑译文质量高于人工翻译。在具体机器翻译问题上,潘正芹[2]等(2017)发现,机器翻译难以跨越文化范畴和视角来进行翻译。[3]人工翻译能统筹双关语、习惯用法等因素,以及读者对象、翻译目的和各种翻译技巧和策略的综合应用,机器目前做不到。而研究人员发现,学者在研究机器翻译这一课题时,所选用的主题均为单一类型文本或者随机文本,结果发现有的文本翻译效果比较好,有些文本翻译效果却不尽如人意,出现大量错误,出现这些错误是否与文本有关?如果以往的研究是基于某个点、几个点或某个面,那么本次研究从更大的多面视角,即基于不同文本的差异,来探讨机器翻译的结果。

(一)文本的选择、类型和特色

文本的选择标准是有明显差异,自成风格的文体,以这个为标准,文章挑选五种类型文本英语原文进行翻译研究,分别是:(1)法律类;
(2)政府工作报告类;
(3)文宣(多指旅游类文本)类;
(4)财经类;
(5)技术(说明书)类。五类文本字数1.5万字。因为考虑到这五类文本各有特色,风格差异较大,其译文应该具有一定代表性,能反映所有类似文体的特征。

法律类文本属于规章制度,语言风格应为庄重严肃、逻辑严谨,以陈述客观内容为主,很少出现个人感情因素,书面语体呈现,句子长而且结构较复杂,很多词汇属于法律性术语。政府工作报告,事关国家政策,大政方针,工作总结,历史回顾,用词要求通俗易懂,但又不能随随便便,模棱两可,而是字斟句酌,准确表达。文宣类的文本应用面比较广,在宣传视频、旅游手册、景区介绍以及地方宣传等都有一席之地。其特点是句子简单,词汇通俗、更大众化,情感浓厚,能激发读者的热情,带有广告和营销的性质。财经类文本内容包含较多专业术语,文本信息丰富,涉及领域宽广,因为专业性强,相关领域读者才会读懂或感兴趣。技术类文本(文章中偏向于说明书文本),内容客观朴实,简洁扼要,少有修辞,但专业术语较多。

(二)实验结果

研究人员选用小牛翻译软件,分别对以上几种文本资料进行翻译实验,分别从一词多义频率、语句连贯性、基础语句准确率、成分缺失、成分赘余和长句译文表现等几方面去观测,得出结果如表1所示:

表1 实验结果

机器翻译的结果,在法律类文本中,正因为法律英语句子比较长,也比较复杂,所以译文的长句表现比较差,但它的严谨性使得译文的赘余和缺失成分较少,政工类文本因为同义重复较多,抽象口号多,机器翻译时可能会一笔带过,对照原文给人成分赘余的感觉,而专业性较强的技术和财经类,一词多义现象就非常少,下面进一步就具体案例进行分析。

(一)案例分析

在法律文本翻译中,一词多义频率较高,例如,在官方译文中,“transfusion”的翻译非常严谨,包含多个意思,而机器译文仅有一个译文“输血”,原文中的“a donor”也只是粗略译成“献血者”,其中的“单一”释义缺乏,是意义上的极大失误;
在语句连贯性方面,有些句式基本语序存在错误。此外,机器翻译缺少语言风格的转变,语言不严谨,仅表现为简单逻辑关系对应,例如:

良好做法准则:良好做法准则解释共同体的标准和规格,第2005/62/EC号指令附件中建立的血液机构质量体系被罚款。

而官方译文为:质量管理规范指南:管理规范指南为血液机构的欧共体质量系统标准与规范给出了解释,这些血液机构按照第2005/62/EC号法令附件所建立。

原文:Good Practice guidelines:Good practice guidelines give interpretation on the Community standards and specifications de-fined for quality systems in blood establishments established in the Annex of Directive2005/62/EC.

出现少量成分缺失情况,例如:

从献血者处采集并经处理后用于输血或进一步制造的全血。

这个译文意义不严谨,官方译文为“经过加工成输液或用于进一步制工成输液或用于进一步制造的全血”。不过我们发现,法律文本翻译出现的赘余成分很少,比较突出的地方是法律文本中的长句翻译成中文后,译文整体效果很差,机器错误理解词汇影响整体译文,例如:“……提到的血液设施是指负责采集和检测人体血液和血液成分的任何方面的任何结构或机构,无论其目的如何,以及用于输血时的处理、储存和分配。”

在政工类文本翻译中,一词多义频率极低,因政工类文本特点用词十分严谨,防止误解。

语句连贯性:较好,具备一定阅读价值;
基础语句准确率较高,逻辑基本正确;
成分缺失较少,有少量成分赘余,例如:18个小时的风雨中,阿什莉冒着带电的电线和深水,帮助拯救了40多条生命。原文为“Through 18 hours of wind and rain,Ashlee braved live power lines and deep water,to help save more than 40 lives.”官方译文为:“冒着长达十八个小时的风雨,阿什莉不顾电线和深水之危,救出四十多条生命。”而在长句译文表现上,机器翻译尚可。

在文宣类文本翻译中,一词多义频率较高(例如,You can spend months exploring big and small.机器译文将其“big and small”翻译为大大小小,而官方译文为“各种各样的博物馆和艺术画廊”,因前面一句提到伦敦有很多此类建筑);
语句连贯性较差,基础语句准确率:较低(例如,机器译文:它只会变成一种模糊的印象,覆盖着疲劳、疼痛和脚;
官方译文:否则这样做只能给你带来数不尽的疲惫以及叫苦不迭的双脚;
原文:It will just become a general blur of impressions overlaid with fatigue and aching and feet.);
少量成分缺失,无成分赘余。长句译文表现也不佳,翻译极为混乱。

在技术类文本中,一词多义频率极低,机器理解效率较高;
语句连贯性一般,基础语句准确率达到较高水准;
但有少量成分缺失,如标题处缺乏主语(例如,Civil Defence pilot drones for search译为民防部门驾驶无人机进行搜索,官方译文为:民防部门搜索式无人机);
出现少量成分赘余(例如,当然,这将取决于全国各地对这项服务的需求,以及它在支持搜索操作方面的成功程度。原文为This,of course,would be dependent on the demand for the service across the country and also how successful it is in supporting search operations.官方译文为:当然,这将取决于各地对该项业务的需求程度以及它的搜索效率);
长句译文表现较差,需要译后编辑才能使读者理解。

最后为财经类文本,文中一词多义频率较低,语句连贯性较差,但基础语句准确率中等。

极少成分缺失,少量不影响理解的成分赘余。长句译文表现较差,例如,不可避免的是,人们担心ais的创造力足以让他们的创造者大吃一惊,这可能会变得邪恶。原文:Inevitably,people fear that ais creative enough to surprise their creators could become malign.官方译文:人们不可避免地担心,人工智能系统的创造力足以让其创造者感到惊讶,这可能会变得有害。

(二)解决方案

经分析总结,得出如下各类型文本机器译文提升方案:

对法律文本,参照平行文本确认基本风格,选用词汇时结合背景知识,模糊之处需咨询相关资料或专业人士,避免模糊翻译。机器翻译难以识别部分文字背后蕴含的深刻含义,研究人员认为在法律类文本使用机器翻译只能提升部分效率,要达到一篇合格的译文仍需译者多番矫正。

政工类文本用词较为严谨:翻译时使用已有默认官方翻译的词汇,在翻译时考虑英中的句式逻辑差异,添加衔接词使句子连接更加连贯,避免使用同一词汇。使用机器翻译政工类文本能够提升翻译效率,但细节处必须留意,否则造成语义偏颇的负面影响非常严重,如新词以及文化特色词需校对修改。

文宣类文本由于阅读人群广,此文本出现较多口语化词汇,部分原文由于原目标读者为源语读者,部分内容未作注释,但翻译后读者变为其他语言读者,会出现其他语言读者理解不到位的情况。因此,在对历史文化底蕴丰厚的内容进行机器翻译时,了解背景知识,防止错译引发目标语读者反感。注意源语文本整体语言风格,将目标语风格同步,尽量追求目标语读者在阅读译文时产生和源语读者一样的效果,这也是文宣类文本的初衷。

技术类文本的整体译文流畅度具备一定可读性,较之前面几篇机器译文来看,部分内容已经符合最基本阅读需求。对该类产品进行大致了解,防止出现基础常识错误。将语言进行本地化处理,消除机器翻译痕迹,以符合目标语读者阅读习惯。

财经类文本长句难度较高,机器翻译难以理解句子整体含义。使用机器翻译遇到句式杂糅或结构复杂的长句时,建议翻译人员亲自翻译,并加强自身长句处理能力。而在其他短句上,除了有较为明显的机器翻译痕迹,机器译文准确率处于较高水平,因此,财经类文本使用机器翻译可以节省翻译人员的不少精力,但不能过多依赖。

机器翻译,差之毫厘,谬以千里,所以机器翻译的研究随着机器翻译的应用不断发展,其目的是,一是告诫机器翻译从业者,机器翻译除了速度远超人类,其他方面远未达到人工翻译的水准,机译后编辑任重道远;
二是告诉翻译教学工作者,不要对翻译软件盲从和迷信,只有打好坚实的翻译基础和能力,才能应用好手中的翻译软件,胜任机译后编辑工作;
三是告诉翻译软件开发者,翻译软件的研发要达到很高水平,还有很长的路要走。

机器翻译与人工翻译虽然目前仍存在差距,但仍具备优点。首先,机器翻译速度极快,在翻译句子结构相对简单和词义相对单一的文本,机器翻译占据优势。因此,人工若能够熟练掌握机译后编辑技能,势必能够极大提升翻译效率。而从本次项目的研究来看,机器翻译存在的最大问题就是缺少对原文以及目标语的背景认知,因此为了提升译后编辑的效率,了解翻译材料背景知识应为重中之重,再结合研究人员针对各类型译文的分析及提升方案,相信译者在处理各类型文本时的能力会更上一层楼。

根据研究结果,机器翻译目前仍任重道远,虽在不同类型文本中的翻译准确率有高有低,但即使是根据材料表现来看准确率最高的技术型(说明书)文本,仍存在诸多模糊的译文,无法完全替代人工译文。经过项目研究对比,研究人员最后得出结论,以供相关人员参考:

机器翻译在进行各种文本的翻译时,综合表现结果不佳,难以把握准确表达,导致语义错误,语句连贯性差;
机器翻译输出译文难以体现原文的风格,只是机械地逐字逐句翻译。在长句或句式成分复杂的句子中,机器翻译效果不佳,这体现在译文逻辑混乱、语法错误、句式杂糅凌乱、缺乏本地化风格调整上。但机器翻译在处理基础语句上准确率尚可,成分缺失、成分赘余也较少出现,整体上体现出难度较低部分文本翻译准确率高,长句、复合句以及容易出现多义词的句式上翻译准确率不佳的特点。

猜你喜欢多义长句语句重点:语句衔接新世纪智能(语文备考)(2020年4期)2020-07-25英语语言特点视角下英语长句翻译的解读大陆桥视野(2017年22期)2017-12-23吼唱在关中大地上的“秦腔”——论小说《白鹿原》中长句和排比句的秦腔韵味现代语文(2016年21期)2016-05-25维吾尔语动词“t∫iqmap”多义范畴的语义延伸机制语言与翻译(2015年2期)2015-07-18《锦瑟》赏析新课程·上旬(2014年9期)2014-11-22多车道自由流技术在多义路径识别领域的应用中国交通信息化(2014年5期)2014-06-05如何搞定语句衔接题语文知识(2014年4期)2014-02-28俄语动词隐喻的语义解读*——兼动词多义的分析外语学刊(2011年5期)2011-01-22作文语句实录小雪花·初中高分作文(2009年8期)2009-11-16长句变短句方法例谈中学教学参考·语英版(2008年8期)2008-11-26

推荐访问:机器翻译 启示 文本