繁简转换

本页使用了标题或全文手工转换,现处于中国大陆简体模式
求闻百科,共笔求闻

繁简转换,或简繁转换,指繁体字简体字的互相转换,实际使用时通常包括台湾香港澳门中国大陆新加坡马来西亚地区所使用的标准中文之中不同字、词的相互转换。由于中国大陆汉字简化并非全部采用“一对一”方式,有部分用字采用“一对多”方式,因此准确的汉字转换相当困难。目前已经有相当多的专业人士正利用各种方法解决这个难题。

需求和难点

很多国际性公司和机构都需要将重要的外文文字同时翻译为简体中文和繁体中文,而许多重要中文文档往往一经写出,就要求同时发布简体中文版和繁体中文版。这些转换需求中最常见的是多语软件、多语网站和一些面向多语用户的重要国际性文档。同时生成、发布简体版和繁体文档最直接也最常见的方法就是先编写简体中文版或繁体中文版,然后再通过简繁转换或繁简转换,生成与之相对应的繁体版或简体版。

由于简体字和繁体字在许多语言表达的细节上有差异。例如:简体中文中的“服务器”,在繁体中文中的专业写法是“伺服器”,简体中文中的“圆珠笔”,在繁体中文中多用“原子笔”,简体中文里的“斯大林”在台湾被称为“斯大林”,简体中文里的“朝鲜”〔此处特指平壤政权〕在繁体中文里常被称为“北韩”,简体中文里的“悉尼”在台湾被称为“雪梨”(澳大利亚城市),著名的RPG游戏软件Final Fantasy,在中国大陆一般译为“最终幻想”,而在香港、台湾旧译为“太空战士”。

简单转换和专业转换

电脑专业人员,通过电脑软件对繁简字作对应处理,虽然在技术上逐渐完善,但最专业的转换,往往仍需求人工参与。根据转换专业程度上的差异,简繁转换大致可分为简单的“字对字”转换、经部分修正的简繁转换和高度专业的专业性简繁转换。

字对字相互转换

方法

就是简单地将每个简体字转换为对应的繁体字。网络上可以找到大量的免费软件、网站和转换代码,他们做的一般都是字对字的简单转换,或在字对字转换基础上加上很少的修订。

效果/作用

大部分所谓的繁简转换都只能作“一对一”转换,常见的有“发”对“发”,但“发”则无法转换成“髮”。

只能用于非正式资料的资料级转换,大多数情况下目标语用户能看懂。但由于在地域上词汇用语的差异,经常容易让目标地区的读者产生理解上的困难。转换品质相当弱。如果一位简体中文用户看见下面的句子,即使大致句子结构能看懂,但在句子意思上则难以解读。

例句:

  • 他用数据机发出一个归位字元
  • 碧咸老挝见到了布希

字对字的繁简转换结果:

  • 他用数据机发出一个归位字元
  • 碧咸老挝见到了布希

简体中文中的正确说法:

  • 他用调制解调器发出一个回车字符
  • 贝克汉姆老挝见到了布什

词对词相互转换

能正确判别“头发”应对应至“头髮”而非“头发”,“喷发”应对应至“喷发”而非“喷髮”。

地区用语转换

方法

典型的例子是Google翻译中以简体中文和简繁中文为目标语的翻译和Microsoft WordExcel中的简繁转换功能。其中Google翻译中的修订仅限于字级别上的修订,而Microsoft Word的转换品质相对较好,作了很多修订,不过转换结果中仍可以找到大量未修订,不符合目标语表达习惯的地方。

效果/作用

Google只做了字级的基础修正,如简体中文中“头发”和“发现”/“发生”中的“发”是一个字,但在繁体中这两个发不一样(“头髮”、“发现”/“发生”),Google对大多数这类情况进行了适当的修订,但Google并未进行词级上的修订,如从简体中文的“软件”、“服务器”译入繁体中文时,Google只是译为“軟件”、“服务器”,并未根据繁体表达习惯,译为“软件”、“伺服器”。

而Word(以及Bing翻译)在词级上作了一些修正,可以让目标语的用户感觉亲切一些,但如果细究起来,Word的转换结果在很多地方与真正的目标语表达习惯仍有相当明显的差距。

再看前面提到的句子,

  • 他用数据机发出一个归位字元
  • 碧咸老挝见到了布殊

用Word对上面的初始繁体中文句子做繁转简后,结果如下:

  • 他用调制解调器发出一个归位字符
  • 碧咸老挝见到了布殊

而如用Word对上面的初始简体中文句子做简转繁后,结果如下:

  • 他用数据机发出一个回车字元
  • 贝克汉姆老挝见到了布希

参见