胡显耀李佳| 跨语域人机翻译语言规范化特征的变体计量学研究

来源：https://mp.weixin.qq.com/s/IU73PtLz5QjFG19HOG-HpQ

跨语域人机翻译语言规范化特征的变体计量学研究

胡显耀李佳

西南大学

胡显耀

胡显耀，西南大学外国语学院教授，博士生导师，副院长。华东师范大学博士，北京外国语大学博士后。曾任英国索尔福德大学访问学者，加州大学洛杉矶分校富布赖特高级访问学者，英国兰卡斯特大学语言学和英语系研究助理。研究领域：翻译学、语料库、文体统计学、翻译社会认知、应用语言学和二语习得。出版学术专著5部，在《外语教学与研究》《外国语》《中国翻译》《中国外语》Corpus Linguistics and Linguistic Theories等期刊上发表学术论文40余篇，主持国家社科基金重点项目“社会认知翻译学的理论建构与实践探索”（2021）、国家社科青年项目“基于语料库的翻译认知模式研究”（2011）、教育部哲学社会科学规划项目“汉语文学翻译语料库建设与研究”（2008）和重庆市社科基金规划项目2项，曾主持建设“当代汉语翻译小说语料库”“翻译英语语料库”等，从事法律、财经、儿童文学和科普著作的翻译，出版译著5部，发表译文数十万字。

摘要

摘要：

规范化或保守化是一种翻译共性，指翻译的语言倾向于采用译入语中典型的、常见的和正式的语言形式。该研究基于四个百万词规模的可比语料库，采用变体计量学方法，考察人工译文与机器译文的正式或非正式词汇和语法特征，对比二者的规范化趋势。结果显示：(1)英语人工译文相较于原创英语在四个语域中均呈现规范化特征。(2)机器译文只在新闻和小说语域中存在规范化倾向，在学术和普通语域中规范化特征不明显。(3)人工译文相较于机器译文的规范化趋势更为显著。这些发现可能反映了人工翻译与机器翻译的重要区别：前者受语言、社会文化和认知因素的共同约束，更容易出现规范化；后者主要受基于先例的“算法偏见”影响，偏向于直接复制人工译文的特征，对社会认知因素不敏感。

关键词：

翻译共性;规范化;变体计量学;社会认知

文献来源：

胡显耀,李佳.跨语域人机翻译语言规范化特征的变体计量学研究[J].外语电化教学,2025,(02):37-46+102.DOI:10.20139/j.issn.1001-5795.20250206.

引言

翻译共性是指“翻译的语言呈现出不同于原创文本的典型特征，这些特征并非特定语言系统干扰的结果”(Baker, 1993),是语料库翻译学的关键概念之一。学界讨论较多的翻译共性特征包括简化、显化、规范化、原语透过效应、独特项假说等。其中，“规范化”(normalization)或“保守化”(conservatism)(1)是Baker(1996)提出的一种共性概念，指“翻译的语言呈现更多与译入语相似的特征，甚至超出了正常范围”。Becher(2010)在显化的基础上，提出了“保守化假设”,即翻译语言相较于原创语言更倾向于使用正式的语言表达。De Sutteret al.(2012)采用变体计量学(Lectometry)的方法探究了保守化倾向，发现翻译荷兰语相较于原创荷兰语整体更倾向于使用正式词汇变体，但这一倾向在不同的原语类型与语域中存在差异。Huet al.(2019)采用多维分析法对96个语言特征进行了分析，发现翻译英语与原创英语相比存在显著差异，其中一些特征与语言正式体密切相关。总体而言，学界对规范化的关注较少。此外，翻译共性研究几乎全部集中于人工译文，对“机器翻译共性”(machine translationese)的探讨还处于起步阶段(Jiang & Niu, 2022)。然而，在大语言模型与人工智能技术的推动下，人机协同翻译正逐渐演变为不可逆转的趋势。机器翻译有何特点?人工翻译和机器翻译有何区别?人类相较于人工智能是否有不可替代的“优势”?本文尝试从人机翻译的规范化特征来探讨这些问题。

规范化与人机翻译语言对比

2.1 规范化的概念

规范化的概念由Baker(1996)首次提出。这个概念与Toury(1995)的“标准化提高法则”(law of growing standardization)、Malmkjaer(1998)的“过度典型化”(hyper-typicality)和Chesterman(2013)的“常规化”(conventionality)等概念相似，都是指翻译文本总体上具有一种保守化和传统化趋势，倾向于使用译入语中更典型、更规范或更正式的形式。因此，早期的规范化研究主要考察译文中译入语特征呈现过度、新造词和罕用词减少、句法形式更规范等现象。值得注意的是，存在与规范化相对的另一种翻译共性，即“原语透过效应”,指“翻译语言呈现与原语相似的语言特征”(Teich, 2003;戴光荣， 2015;胡显耀、曾佳， 2017)。

在语料库翻译学中，对规范化的研究并不充分，且存在一些相互矛盾的证据。同时，这个概念也与简化和显化共性存在重叠(参见胡显耀， 2021)。2010年以来，一些学者尝试对规范化概念进行扩展。其中，Becher(2010)在显化的基础上提出了“保守化假设”的概念。保守化得到了De Sutteret al.(2012)的验证和支持。Kruger & De Sutter(2018)和Kruger(2019)重新考察了翻译英语中选择性关系代词that的省略和保留，尽管这种现象在翻译共性研究中一般被作为“显化”特征(如Burnett, 1999;Olohan & Baker, 2000;Olohan, 2003;Williams, 2005),但Becher(2010)和Kruger(2019)认为that的使用与语言正式程度相关，正式程度提高也是一种保守化的翻译策略。胡显耀等(2020)也发现了一组可能与翻译英语中正式程度提高相关的特征，如更多使用关系结构、更多用裹挟式结构而较少用介词悬空结构、更多使用单个动词而较少用短语动词及大量使用连接词等。

概言之，规范化、标准化和保守化等概念的共同点是都主张翻译文本中存在遵从译入语规范，使用典型或标准的译入语表达形式的倾向，译者似乎有一种“规避风险”的意识(Pym, 2020)。这些概念的不同之处在于：规范化、标准化强调遵从译入语规范，而保守化主要是指倾向于使用正式的语言形式。本文主要考察的是人机翻译在词汇语法正式程度上的差异。

2.2 人机翻译对比

随着大语言模型和人工智能的发展，“机器翻译+译后编辑”(MTPE)模式逐渐成为翻译行业的主流趋势。这一模式对传统翻译行业和译者产生了很大的冲击。一方面，机器翻译的普及促进了无障碍传播，但同时也导致了译者身份的贬值(任文， 2019);另一方面，由于机器翻译在网络社交平台的广泛使用，使人们形成了翻译不在场的新型刻板印象，造成了一种“数字化隐形”(digital invisibility)(Desjardins, 2016)。这些趋势促使我们思考：人工智能时代人工翻译是否还有存在的价值?人类译者相对于机器翻译是否有不可替代性?

尽管人机翻译对比研究才刚刚起步，但学界对上述问题已经进行了一些有价值的思考。Volanskyet al.(2011)较早对比分析了人机翻译语言的异同，发现机器翻译既会继承人工翻译的特征，也存在一些独有的语言形式。Kuo(2019)考察了人机翻译汉语中的功能词，发现机器翻译中也存在功能词超用的现象，同时呈现规范化和原语透过效应的特征。Bizzoniet al.(2020)对比了人机翻译语言中的词性标注困惑度和依存距离(2),发现基于统计的机器翻译在句法结构上较为简化，而神经网络机器译文则与人工译文较为相似。他们认为这可能是由于机器翻译和人工翻译的主要模式存在差别：前者主要以句子为单位，而后者更多考虑篇章层面。梁君英、刘益光(2023)在对比人机翻译在词汇、句法和语篇特征差异的基础上，指出人类译者相较于机器翻译具有三种优势，即“结合语境和百科知识准确完成双语转换的能力优势、以译文受众为中心简化语言表达并提高篇章衔接的交际能力优势、针对目标场景善用特定表达的语用能力优势”。于蕾(2024)对比了ChatGPT译文与人工译文的词汇和句法复杂度，发现ChatGPT在词汇使用和某些句法指标上更为复杂。然而，Niu & Jiang (2024)发现，谷歌翻译与DeepL翻译的文本在词汇层面更为简化。Vanmassenhoveet al.(2019)也有类似的发现，即机器译文的词汇多样性较低，他们认为这些特征可能与机器翻译中的“算法偏见”(algorithmic bias)有关。算法偏见是指“由于机器翻译主要以人工翻译为训练数据，因而人工翻译的某些语言特征或倾向会在机器译文中得以保留，甚至强化”(Niu & Jiang, 2024)。Krüger(2020)发现， DeepL的译文虽然也呈现出显化的特征，但由于其无法理解语境差异而表现出比人工翻译更大的随机性和无目的性。Jiang & Niu(2022)发现，机器翻译更倾向于使用表层衔接方式，而人工翻译则利用动词衔接和语义相似构建了更为深层的衔接模式。

研究设计

3.1 语料库构建

本文采用可比语料库的设计，共使用了四个语料库：原创英语、人工翻译与两个机器翻译语料库。其中，人工翻译与机器翻译的原文相同。原创英语采用了FLOB语料库(Freiburg Lancaster-Oslo/Bergen Corpus)。该语料库为百万词英国英语平衡语料库，涵盖文学与非文学两种类型，新闻、通用、学术和小说四种语域，报道、宗教、传记等15种体裁，共包括500个文本，每个文本约2,000词。人工翻译采用了兰卡斯特大学与香港理工大学编制的COCE语料库(Corpus of Chinese into English)。该语料库参照FLOB的设计，包含汉语原文与英语译文两个子库(Liu & Afzaal, 2021)。

机器翻译语料分别采用谷歌翻译和DeepL翻译将COCE语料库中的汉语原文翻译为英文，从而构建了COCEG和COCED两个机器翻译语料库。选择这两个机器翻译系统的原因是：谷歌翻译是目前最为普及的在线机器翻译平台，每天承担约1800万词的翻译量(Statt, 2016;Kuo, 2019);而DeepL翻译基于Linguee语料库进行训练，其翻译质量在众多神经网络机器翻译系统中更为出色(Krüger, 2020)。表1为本文所使用的四个语料库的结构信息，均按照布朗家族语料库的规范建立，总文本数量为2,000个，总形符数400余万词。

3.2 变体计量学

变体计量学是认知社会语言学中一种新兴的分析语言变体的量化研究方法(Kristiansenet al., 2021)。该方法由Geeraertset al.(1999)首次提出，最初用于分析标准荷兰语和比利时荷兰语之间的词汇变体差异。其核心概念为“命名轮廓”(onomasiological profile),指“一个概念的各种同义名称的集合，这些名称的使用频次不同”(Speelmanet al., 2003)。例如，“automobile”和“car”均表车辆这一概念，“’s”所有格与介词“of”均表所属关系，这两组词分别构成了“车辆”和“所属关系”这两个概念的轮廓。变体计量学通过分析概念或功能的“轮廓”来解释语言变体的差异(Plevoets, 2020)。这种方法与传统的语域分析(Re-gister Analysis)和方言计量学(Dialectometry)相比，纳入了更多言外因素，可以考察时间、空间等因素对语言变体的影响(Ruetteet al., 2016)。

变体计量学方法在翻译语言特征研究中有一些应用。例如，Delaere & De Sutter(2013)比较了以英语和法语为原语的翻译荷兰语在使用标准或非标准词汇变体上的差异，发现虽然整体上翻译荷兰语呈现标准化的特征，但原语类型和语域内部存在显著差异。Prieels & De Sutter(2018)分析了比利时字幕翻译中的词汇和句法变体差异，发现虽然在弗兰德斯地区比利时荷兰语广泛盛行，字幕译者却倾向于使用标准荷兰语而非比利时荷兰语。

3.3 特征选择及分析方法

本文基于变体计量学来分析人工译文和机器译文在表达同一概念或功能时在正式程度上的变体差异。根据变体计量学的要求，笔者采用了短语动词和缩写形式两类特征代表非正式体，采用单个动词和非缩写形式代表正式体。选择这两类特征的原因是：(1)翻译共性研究中，短语动词和缩写形式是分析译文规范化程度的关键特征(如Olohan, 2003;Redelinghuys & Kruger, 2015;Cappelle & Loock, 2017;胡显耀等， 2020)。(2)短语动词和缩写形式通常更多用于口语表达等非正式场合，而单个动词和非缩写形式主要用于学术写作等正式场合(Liardétet al., 2019)。(3)英语语体分析研究表明短语动词和缩写形式与正式体相关。例如，Biber(1991)的多维分析显示，缩写形式在第一维度(交互性与信息性)中具有较高的因子载荷，该维度往往与正式体相关(Hyland & Jiang, 2017)。Liu(2011)比较了不同语域中短语动词的分布情况，发现短语动词在正式文本中的频次显著更低。

关于具体语言特征的选择，本文采用了De Sutteret al.(2012)和Delaere & De Sutter(2017)提出的筛选方法。该方法要求同时采用两个权威的语言资源(如词典、同义词典或语料库)来确定某一语言特征是否能区分正式或非正式体。这种区分不存在地区差异(如英式或美式英语),且该特征下的正式和非正式变体在各子语料库中可以被成功检索(频次≥1)。本研究采用了《牛津高阶英汉双解词典》(3)的正式词汇表，同时参考《剑桥英语词典》(4),确定了一组表示正式体的单个动词和非正式体的短语动词。缩写形式则采用了not否定式，原因是相较于动词缩写(如it’s、 we’ll), not否定式能够突显否定或反对义(Yaeger-Dror, 1997),而动词缩写一般不充当语义作用(Bresnan, 2021)。因此，笔者采用了Kjellmer(1997)所列的否定式缩写或非缩写形式作为区别正式或非正式体的特征。表2为本研究采用的6对动词和15对否定式。

由于可完全相互替换的绝对同义结构较为罕见，更常见的是近义结构(Edmonds & Hirst, 2002)。例如，“ascend”和“go up”都有“上升”义，一般情况下可互换，但在某些特殊语境下，如“ascend the throne”(登上王位)不能改为“go up the throne”。本研究中，为了比较人机翻译在正式或非正式倾向上的差异，需要保证所选的词汇和语法特征具有互换性。因此，笔者邀请了两位英语母语者对预先选择的正式或非正式特征(见表2)进行再次筛选，确认这些特征在具体语境中可以相互替换。筛选过程采用了二元选项(可替换或不可替换),并检验了两位筛选者的一致性。结果显示， Cohen’s Kappa值为0.855(p<0.001),表明一致性良好。最终保留有效数据词汇特征1,428条，语法特征21,133条，共22,561条。

本文采用了Plevoets(2020)提出的基于轮廓的对应分析(profile-based correspondence analysis)(5)。该模型考虑每组语言变体之间的关系，即同一个概念或功能的不同变体的相对频次差异，将原始变量转化为双标图进行模型结果解读。笔者将正式与非正式词汇语法变体作为响应变量，将文本类别、语域作为主效应(6),并将二者交互项(7)作为交互效应搭建模型。模型结果显示，前两个维度的方差总解释率大约为85%,这与Delaereet al. (2012)和De Sutteret al. (2012)的结果相似，说明模型结果整体良好。

体间性话语策略的体现方式

4.1 主效应分析

图1为对应回归模型的主效应双标图，图中横坐标为维度1,方差解释率为75.19%;纵坐标为维度2,方差解释率为10.16%。由于维度1解释了绝大部分方差，故四种文本类别的正式度排序以维度1 为准。图1中正式的词汇语法变体主要位于横坐标的左侧，而非正式变体主要位于右侧。图中的椭圆为95%置信椭圆，说明当两个文本类别的置信椭圆不相交时，两个类别在选择正式或非正式语言变体上存在显著差异(p<0.005)。

由图1可知，四种文本类别之间的置信椭圆均不存在交叉情况，因此就选择变体特征而言，四种文本类别之间存在显著差异。图1中人工翻译与DeepL翻译位于横坐标轴的负数区间，而谷歌翻译和原创英语主要位于正数区间。人工翻译位于最左侧，两个机器翻译居中，原创英语位于最右侧，这说明人工翻译与机器翻译整体而言比原创英语更倾向于选择正式的词汇语法变体。因此，翻译语言相较于原创原语呈现了明显的规范化倾向。此外，由于人工翻译最靠近左侧正式变体，说明人工翻译呈现出了最明显的规范化倾向。

4.2 交互效应分析

本文还分析了语域对于正式或非正式倾向的影响。语域作为影响翻译语言特征的一个重要因素，却往往在许多研究中由于语料库的设计问题未能被全面考察(Delaereet al., 2012;Cappelle & Loock, 2017;De Sutter & Lefer, 2020)。在Delaere & De Sutter(2013)、Kruger & De Sutter(2018)和Kruger(2019)的研究中，语域被视为反映译者风险规避意识的一个重要变量，即译者考虑到不同语域中的语境差异可能会选择不同的语言策略，因而在不同语域中，翻译语言特征存在一定程度的变异。

图2展示了语域与文本类别的交互效应。首先，新闻语域中，人工翻译位于横坐标最左侧，DeepL翻译与谷歌翻译位于中间，而原创英语位于最右侧。由于四个文本类别的置信椭圆不存在交叉，说明人工翻译新闻与机器翻译新闻比原创新闻正式程度更高。此外，这一位置关系也表明人工翻译相较于机器翻译更倾向于选择正式的词汇语法变体。同时，在新闻语域中，谷歌翻译的正式度高于DeepL翻译。

通用语域中，人工翻译位于最左侧，其次为原创英语和DeepL翻译，而谷歌翻译位于最右侧。这一位置关系说明人工翻译依然更倾向于使用正式词汇语法变体，但该语域中机器翻译并不比原创英语更正式，反而更倾向于选择非正式变体。学术语域中，四种文本类别的差异明显比较小，但人工翻译仍然位于最左侧，且与其他文本类别不存在交叉。原创英语与DeepL紧随其后，且置信椭圆存在交叉，说明二者无显著差异。谷歌翻译位于最右侧，与原创英语和DeepL翻译也存在交叉。这说明人工翻译在学术语域中仍保持着更高的正式程度，而机器翻译与原创英语在选择正式变体方面无显著差异。小说语域中，四种文本类别从左至右依次为人工翻译、DeepL翻译、谷歌翻译和原创英语，且置信椭圆无相交情况。因此，人工与机器翻译的小说文本相较于原创文本均更为正式，但人工翻译的正式化程度要明显高于机器翻译。

4.3 讨论

上述分析结果显示，无论在主效应还是交互效应中，人工翻译始终呈现最强的规范化趋势。机器翻译虽然整体上也存在规范化倾向，但在通用类和学术文本中未出现明显的规范化或正式化，这说明语域对翻译语言特征的形成有较大的影响。下文具体讨论人工译文中规范化趋势形成的社会认知动因及人机翻译语言规范化特征差异的意义。

首先，人工翻译在整体上及不同语域中均呈现显著的规范化倾向。这体现在对应回归分析双标图中，人工翻译在所有语域中始终居于正式词汇语法变体一侧。该发现得到了一些研究的佐证，如Delaere & De Sutter(2013)、Kruger(2019)等。这一倾向说明，人类译者倾向于遵守译入语的社会文化规范(Toury, 1995)。此外，从交互效应来看，该倾向也反映了风险规避意识对译者语言决策的影响(Pym, 2020)。以小说为例，小说文本包含大量对话和生活场景，对语体正式程度的要求较低。Kruger(2019)认为，这类文本交际风险较低。然而，人工翻译在小说文本中也出现了明显的规范化倾向。Sela-Sheffy(2005)认为，这可能是由于译者缺乏足够的象征资本，因而常常被迫选择规范化语言策略，遵从既定的社会和语言规范。否则，可能面临“剥夺资格”“羞辱”“排挤”等不良后果。从社会认知的角度来看，人类的认知方式往往由环境所塑造，并通过社会化过程所习得(Sapir, 1927)。因此，人工翻译中的保守化趋势可能来自翻译所处的社会环境的压力。Shreve(2012)提出，译者采用的翻译策略会逐步稳定和固化为一种认知方式，这些固化的认知方式可以帮助提高翻译效率。Robinson(2020)也持类似的观点，即译者的翻译策略受所处的社会环境的影响，规范化倾向的产生可能是经验固化为认知方式的结果。因此，在创造性或差异性不被看好的翻译空间内，遵守规范、规避风险等策略逐渐固化为人类译者的一种潜在认知加工方式。

其次，机器翻译整体而言也呈现规范化倾向，但语域对机器翻译语言特征的影响较强，机器翻译在通用和学术文本中的规范化特征不显著。机器翻译的规范化趋势可能来自“算法偏见”的影响，即机器翻译主要以人工译文为训练数据，故容易在译文中携带、凸显和夸大人工翻译的语言特点。该发现与Jiang & Niu(2022)和Niu & Jiang(2024)的研究结论一致。然而，与新闻和小说相比，通用和学术文本中机器翻译的规范化趋势不明显。这种差异可能反映了机器翻译和人工翻译操作模式的差别：目前的机器翻译主要以句子为单位进行，而人工翻译则更多关注篇章、文化差异等层面。总体而言，机器翻译缺乏对语域、语境、心理以及文化细微差异的感知(Bizzoniet al., 2020)。以语域为例，相较于新闻与小说，学术与通用文本更专业化，与受众的社会距离更远。因此，无论是机器翻译还是人工翻译都更倾向于关注译入语相关领域的专业要求，一定程度上弱化了对受众接受的考虑。与之相反，新闻和小说文本需要直接面对受众和读者，即读者的需求形成了一种对翻译的社会规范或压力，因而规范化的趋势更明显。此外，本研究发现，不同的机器翻译引擎在不同语域中的规范化特征存在差异，在大多数语域中DeepL翻译比谷歌翻译呈现了更强的规范化倾向，但新闻文本中谷歌翻译的规范化倾向则强于DeepL翻译。这可能是由于机器翻译在训练数据、模型架构和算法选择上存在差异，这些差异也会进一步影响机器译文的语言特征(Jiang & Niu, 2022)。

结束语

本文采用变体计量学方法和对应分析模型，对比分析了人工翻译与机器翻译中的规范化倾向。研究发现，在对应分析模型的主效应中，人工翻译与机器翻译整体上均呈现显著的规范化倾向；但在交互效应中，只有人工翻译一致性地更倾向于选择正式的语言特征。机器翻译只在新闻与小说文本中存在显著的规范化倾向，而在学术与通用文本中与原创英语无显著差异或更倾向于非正式特征。此外，由于训练数据和设计架构等因素， DeepL与谷歌翻译在不同语域中的规范化倾向存在差异。这些发现对翻译语言特征和人机翻译对比研究具有一定的推进价值，也为人工智能时代人机协同翻译模式的实践和教学提供了一些参考。

人机翻译语言的差异说明翻译行为中潜在的社会认知因素。人工翻译呈现更强的规范化特征说明人类译者对译入语语言、社会和文化规范及其风险具有敏锐的感知，从而采取更规范、更保守和更正式的语言策略。而机器翻译目前可能还无法充分意识到这些规范和风险，只能基于人类的先例和算法来实现翻译行为。虽然机器译文在整体上与人类译文具有相似的规范化，但在语域或语境发生变化时，机器翻译对社会认知因素不敏感或相对滞后，因而一定程度上缺乏社会适应性和灵活性。简言之，人机翻译的差异说明翻译并非是一个机械化和自动化的简单过程，而是一个与社会认知因素紧密相关的动态和复杂行为。这意味着在人机协同翻译模式中，人类译者在对机器翻译预处理后的文本进行译后编辑时，应更多地关注译文所流通的社会环境和受众需求。同时，在人机协同翻译教学中，我们应进一步明确人类译者和人工智能的差异和优势，完善人工智能辅助下的翻译能力模型和翻译教学体系。

本文是对人机翻译差异和协同研究的一次尝试，采用的语言特征和考察的变量有限，希望未来研究能纳入更多的影响因素，对人机协同翻译模式进行更系统和全面的分析。