2018年1月13日,是汉语拼音创始人周有光先生逝世一周年的纪念日。Google在其首页进行纪念。老人看透世事,在晚年时说:“要从世界来看中国,不要从中国来看世界。中国人对世界太不了解了,好些人狂妄自大,很多时间竞争得很厉害。(这些)我们自己知道,人家也都知道。我们自己封闭自己。”

在不久的将来,当年轻人们在各种电子设备上用语音输入便捷地书写着汉字的时候,不会有人想到,在百年前的民国时期,汉字输入的先驱们为了古老汉字的现代化改革而呕心沥血,彻夜不眠,这些人都是我们国内首屈一指的国学大师或是语言学家,不少人供职于中华民国教育部或是各大高校,或是著名文学泰斗,像赵元任,钱玄同,鲁迅,还有一些不太受国民政府欢迎的学术人士,像瞿秋白,萧三等人,当历史的车轮不可阻挡地驶进现代的时候,汉字作为中国文明和中华文化的最鲜明的代表和载体,也不可避免地被推向了文化和社会各界人士争论的焦点位置。

周有光去年1月14日去世,享年112岁。世界各地使用谷歌的人在星期六纪念周年之际打开Google.com首页的时候,会发现Google
Logo的位置呈现有周有光的头像,以及中文拼音gu ge
和文字“谷歌”的动画和超链接。

民国和大师

实际上想一想,民国离我们并不遥远,孙中山先生逝世于1925年,如今见过他本人的人应该还有不少还健在,见过鲁迅先生并且还健在的人就更多了,比如文怀沙(至少据其自称吧),国民党大佬白崇禧的儿子白先勇至今活跃在戏曲界一线,郝柏村的儿子郝龙斌正准备角逐下一届台湾地区领导人,而当时的各位国学大师的弟子和子嗣们仍有不少活跃在国内外的华人文化圈子里,近几年来随着国学的复兴,像南怀瑾、曾仕强等人也是频频亮相畅销书封面和荧屏,现在这个年代似乎你不是出生在民国或是自称民国某大师的关门弟子你都不好意思被叫一声“国学大师”。
  在民国形形色色的大师中,有一位赵元任先生如今世人所知可能不多,但他的一篇奇文或许不少人看过:《施氏食狮史》,全文只有一个发音shi,但却神奇地能够准确无误地讲述一个故事。这种文体后来又有《季姬击鸡记》、《羿裔熠邑彝》等一些。我记得我是在初二语文课本的课后读物里第一次读到先生这篇文章的,我觉得先生写这篇文章一是恶搞,二是为了说明汉字和汉语的不同,汉字是汉语的书面载体,但汉字也独立成为一个系统,可以不借助于汉语而存在,古汉语的发音我们不知道是怎样的了,但先秦诸子百家的文章我们还可以通过汉字去理解去学习,这篇《施氏食狮史》是汉字,但却不是汉语,这种汉语是没人听得懂的。

施氏食狮史
  石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。
  十时,适十狮市。是时,适施氏适市。施氏视十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。
  石室湿,施氏使侍拭石室。石室拭,施氏始试食十狮尸。食时,始识十狮实十石狮尸。试释是事。
  白话译文:石头屋子里有一个诗人姓施,喜欢狮子,发誓要吃掉十头狮子。这位先生经常去市场寻找狮子。这一天十点钟的时候他到了市场,正好有十头大狮子也到了市场。于是,这位先生注视着这十头狮子,凭借着自己的十把石头弓箭,把这十头狮子杀死了。先生扛起狮子的尸体走回石头屋子。石头屋子很潮湿,先生让仆人擦拭石头屋子。擦好以后,先生开始尝试吃这十头狮子的尸体。当他吃的时候,才识破这十头狮尸,并非真的狮尸,而是十头用石头做的狮子。先生这才意识到这就是事情的真相。请尝试解释这件事情。

谷歌常为庆祝重要纪念日、或纪念杰出人物等对Google首页商标作出特殊变更,推出Google涂鸦(英语:Google
Doodle),其2010年1月的第一个动画涂鸦为纪念艾萨克·牛顿。

汉字胜在读,英文胜在写

这说明了什么问题呢?其实呢,我们的汉字和汉语是两套系统,我们的祖先先产生了汉语,然后牛人仓颉才发明了汉字,汉字是记录汉语的一种形式,它承载着比汉字更多的信息,我们的汉语主要是用于日常沟通,在录音机没有被发明之前,语言只能进行面对面的沟通,而汉字呢则可通过纸和笔进行间接传播,汉字在承载信息方面比汉语强大的地方在于,它可以区别出汉语所区别不出来的东西,比如上面这篇文章,我们能够看得懂,但却听不懂,再比如一些网络热词,我为自己带盐,大清国药丸,等等,如果我们不用汉语,这些梗通通没法玩了。我们在看汉字文章的时候,所获取的信息量远比我们听汉语所获取的信息量要大,速度更是要快得多,因此有学者称,阅读中文材料要比阅读英文材料效率高得多,不是完全没有道理的。
  但是,我们的汉语阅读效率虽然高,但要说书写和录入的效率,和英文相比却种是捉襟见肘,汉字这种象形文字,在清末民初那个大变革的时代,其输入效率在英文打字机的衬托下更是让人捉急,严重影响到了中文信息的录入和传播,甚至在一些逆向民族主义者看来,这也成为了中国落后、汉字文化圈落后的一项铁证。无论如何,当时的一些学者和专家很早的时候就在苦苦探索汉字的高效输入和记录之道。

周有光学识渊博,横跨经济、语言、文化三大领域,曾在复旦大学教授经济学,主持《简明不列颠百科全书》中文版的编译,更因参加建立汉语拼音系统而被媒体誉为“汉语拼音之父”。他和同事们从1955年开始历时三年,以26个拉丁字母为基础,编写了一直通行到今天的“汉语拼音注音符号”,不仅革新了中国人从小识字的方式,也改变了外国人拼中文的发音,北京Beijing不再是Peking了。

中文信息化的漫长之路

在相当长的历史时期中,一种语言文字要想提高输入效率和信息化水平,最方便快捷也可能唯一的方法就是拉丁化。汉字的拉丁化之路最早可追溯到晚明的利玛窦,他经澳门、广东入中国,随后北上京师,沿途经过湖广、两江、南直隶、南京、山东、北直隶等方言区,抵达北京后曾受到过神宗皇帝的接见,最后在徐光启、李之藻等官员的帮助下学会了北方官话,他当时因为翻译的需要自创了一套汉语的拉丁文转写方案,后来这套方案被晚清的西方人威妥玛借鉴并进一步改进,最后形成了第一个被广泛使用的汉语拼音方案——威妥玛式拼音,在清朝末年的中西交往中发挥了重要作用,至今在港澳台和海外华人社会中仍被使用。

韦德国际1946 1

利玛窦

韦德国际1946 2

利玛窦撰《西字奇迹》书稿

威妥玛方案之后的一个方案是邮政式拼音,这主要是被用来拼写中文地名的一个方案,并不能算作全面意义上的汉语拼音方案,不过它的一些使用痕迹贝宝聊到现在,据说清华大学校名的拉丁化写法Tsinghua是邮政式拼音,而不是威妥玛拼音。

韦德国际1946 3

威妥玛

韦德国际1946 4

威妥玛拼音

但是,无论威妥玛拼音还是邮政式拼音,它们发明的初衷都是为了方便外国人认读汉字,其发音规则更接近于西方人,而与中国人的汉语发音有较大出入。而且由于发明者长期在中国南方生活的原因,威妥玛和邮政式拼音更多地考虑到了南方方言的发音方式,导致其与北方话发音相差较大,要想通行全国就更困难了,毕竟是歪果仁发明的东西,还是不了解中国国情呀。

出生在清末1906年的周有光,从清朝、民国、各种战乱一直到现在的政府,经历了20世纪中国所有的动荡。

注音符号是个什么鬼

于是乎,咱们聪明的前辈们早就在思考中国人自己的汉语拉丁文转写方案,也就是我们说的拼音方案。最开始是民国第一狂人章太炎先生发明的注音符号,1913年新政府『国语统一筹备会』制定,1918年教育部正式公布,后来注音符号再次发展了以后这套注音符号被称作『国语注音符号第一式』(这已经是1984年的事情了)。
  注音符号最开始被叫做注音字母,最开始用它来拼音写的语言版本是『老国音』,1913年由『国语统一筹备会』和注音字母同时制定,因为当时语言改革和文字是同时进行的,1919年教育部刊行《国音字典》是注音字母和老国音结合的经典之作,从此以后的各版本《汉语字典》,包括建国后出版的所有《新华字典》都会用注音符号对汉字进行标注,只是我们不用,印象不深而已,但是台湾的小朋友们一定是印象极为深刻的,平时每天都在用啊。

韦德国际1946 5

新华字典使用的注音符号

  在这里要说一句,实际上注音符号和我们也并不遥远,要知道,『汉语拼音方案』直到1958年才公布,而国文教育(后改为国语课、语文课)是从小学就开始的,这样来说,80后、90后的祖辈,70后的父辈(一般55年之前生的居多)大多数人都是通过注音符号开始学习汉字的,当然前提是得上过学、有文化的人,想想也是,『汉语拼音方案』公布之初不就是为了扫盲嘛。所以说,老年人们的汉语拼音总是用不好,80后、90后教爷爷奶奶在手机上用搜狗拼音打字的时候他们总是学不好,说太难,我们不理解,汉语拼音有啥难的啊?实际上是,他们根本没学过汉语拼音嘛,他们学的是注音符号。

民国时候的国语和国文运动是很频繁的,国语标准发音和拼音方案也是经常变动调整,这些都是中国社会国语运动的一部分,可我们大陆的小朋友们今天所熟悉的大概只有和早期共产党人有一些关系的『新文化运动』了。注音符号公布之后经历过多次修改,比如说1932年教育部决定增加一个注音符号『ㄭ』作为ㄓㄔㄕㄖㄗㄘㄙ7个声母单独成音节时的省略韵母(即虚母,又叫空韵),这就是汉语拼音中zhi,
chi, shi, ri, zi, ci, si这七个整体认读音节的来历。

有媒体称,周有光堪称世界上年纪最大的持不同政见者。中评网称周有光具有“自由之思想,独立之人格”;苏培成称其“敢于说真话、说实话”;《晶报》称他“敢讲一般人不敢讲的话”。

国语罗马字的涅磐

大家也看到了,注音符号虽然可以标注汉字,但是这套取自古汉字的符号对民众来说实在过于陌生,也不便于书写和输入,而且关键的问题是,它也没有解决汉语四声的问题,他采用后置符号的方式来标注声调,比如『注』(ㄓㄨˋ),一二三四轻声分别是『不标』『ˊ』『ˇ』『ˋ』『·』,后来的汉语拼音方案和它一个套路,只不过把声调写在上面了,可因为输入不变,现在大家多数情况下实际上是用拼音之后加上1234来标注声调的,比如『注』(zhu4)。这种事后标注的方式很别扭,也无法有效地输入。因此,在1928年赵元任、钱玄同、黎锦熙等专家学者制定了以26个拉丁字母书写、声调通过拼写变化来区分的拼音方案,这一下就厉害了,汉语发音完全由拉丁字母拼写,声调不用另行标注,直接和国际对接,打字机和键盘输入完全无压力。这也是中国政府制定的第一个法定的拉丁字母拼音方案。

韦德国际1946 6

注音符号、国语罗马字、注音二式、汉语拼音对照表

周有光和张允和

差点杀死汉字的北拉

当时在中国,搞汉语拉丁化方案的可不止国罗一家,其他最有影响的是萧三、瞿秋白等人搞的『北方话拉丁化新文字』,被称作『北拉』,北拉和国罗的关系类似于『南拳北腿』、『北乔峰、南慕容』,北拉这一派人基本都有苏联留学背景,以北平、海参崴为基地,瞿秋白就不说了,早期共产党员中的第一才子,可惜最后在党争中被牺牲掉了,不过同情他的人大有人在,他被当作弃子丢给政府枪毙掉的时候,项英因怀疑他是被自己老婆出卖愤而杀妻,和国民党的张灵甫堪称一时瑜亮,而那位萧三先生就是翻译『国际歌』那位,他的哥哥萧子升就是主席早期身边的王明,专门给主席垫脚用的。北拉这一派不怎么受政府待见,在有政府支持的国罗看来,这帮家伙根本就是不入流的,他们也就是在苏联和延安搞一搞,在全国其他地方根本没市场,他们出版那些东西可是违禁刊物呀。

不过客观地说,北拉搞那些东西确实比较坑爹,在苏联几个半吊子砖家的指导下,他们居然搞了一个完全抛弃声调的方案,并且让各方言各拼各的,希望把汉语改造成一种类似于西方的无声调语言,但他们出版的那些破烂玩意儿根本就没人看。

韦德国际1946 7

拉丁化新文字出版物《大众报》

但是你还别说,虽然民国时候北拉没什么市场,建国以后一段时间还真是牛了,由于俄国在东北的特殊存在,东三省率先开始了拉丁化汉字的试点工作,五十年代东北某些地区的语文教材是这样的:

韦德国际1946 8

拉丁化汉字课本

韦德国际1946 9

课文

这完全就是要把中国改造成外蒙、外西北的样子,可笑当时国家副主席、东北王高岗还觉得东北地区“苏化”的还不够,提出要把东三省并入苏联,当作苏联的一个加盟共和国,这样的脑残方案,不死才怪,果然没多久高岗就和饶漱石一起game
over了,不过这个什么拉丁化汉字还是在东北地区存在了十年左右。
  想想俄国人改造下的外蒙、外西北的命运吧,外蒙人在俄国人的“帮助”下,很快抛弃了老蒙文,用上了西里尔文,一用就是几十年,如今又开始用拉丁字母,现在的蒙古国,最通行的文字可能这两种都不是,而是俄文。而在外西北,东干人也逃脱不掉斯大林对落后民族的“改造”,成为唯一抛弃了汉字的海外华人,当然从另一个方面来说,东干语拉丁化拼音方案也是唯一投入实际使用并替代了汉字的汉语拼音方案。

说完北拉,再来说说本文的主角儿国罗,在延安、北平、东北地区的北拉顽主们忙得不亦乐乎的时候,教育部的国罗方案在动荡的时局中开始了全国范围的推广,看过《驴得水》的朋友大概有所了解当时的教育系统是个神马水平,再加上国罗的四声变形规则相对较为复杂,在全国并没有得到有效的推广,不过研究者们还是以极大的热情编写了很多教材,像是黎锦熙《国语罗马字模范读本首册》(1930)和赵元任《新国语留声片课本》(1935),但总的来说,影响力有限。中国小学校里还是都采用注音符号来给汉字注音。
  应改说明一下,注音符号又被称作“注音字母”、“国音字母”,那么国语罗马字公布之后就被称作“国音字母第二式”,这和“国语注音符号第二式”不一回事,所谓“注音二式”指的是1986年台湾教育部推行的一种注音符号的替代方案,当时台湾教育界的语言学家觉得注音符号与国际通行的拉丁字母格格不入,于是在国语罗马字的基础上去掉了声调的变化拼法,采用了和汉语拼音一样的升降调符号标注,把这套规则命名为“注音二式”,和“注音一式”并行,但实际效果有限,后来又演变为通用拼音,那是因为李登辉、陈水扁这帮人认为注音一式和注音二式都不能有效拼写台湾人的标准发音,于是用改良的“通用拼音”来拼写台湾人特有的发音,但实际上国际上早就通行了以汉语拼音方案作为中文地名拉丁化标准翻译的方案,通用拼音又能发挥多大作用呢,所以在2008年,马英九政府一上台就废止了通用拼音方案,全岛统一采用汉语拼音作为地名拉丁化翻译的标准拼写方法,至此,注音二式和通用拼音短短十多年的使用历史宣告终结,大陆的小伙伴们到台湾旅游也可以愉快的看到标注了汉语拼音注释的繁体字路牌了。

周有光夫人张允和是当代著名昆曲研究家,著名的合肥四姊妹之一,她与周有光相濡以沫、举案齐眉70年,二人的爱情故事成为一段佳话。 
以上美国之音等报道综合

注音、译音和拼音

事实上,国罗在公布之初,设计者们是希望它能够作为汉语拉丁化拼写的标准拼写方案的,其实国罗的设计方案和日本、韩国、越南的罗马字方案非常类似,学习日、韩、越小语种的同学们一定都对“罗马字”的概念非常的熟悉,其中,日语、韩语没有声调,不存在声调变化变化拼写规则的问题,但是越南语和汉语一样存在声调的变化,而越南语的声调拼写变化规则和汉语的国语罗马字也非常的相似。
  正是由于这个原因,国语罗马字在1940年被教育部更名为“译音符号”,以示与“注音符号”的区别,所以总得算起来,清朝以后中国政府颁布的汉语拼音方案一共有三套,汉语注音方案,汉语译音方案和汉语拼音方案,“汉语拼音方案”在1958年以前并不是一个专有名词,在几个通用的拼音方案里,注音方案影响力最大,使用时间最久,使用范围最广,汉语拼音方案最为年轻,在国际上传播范围最广,但要说合理性,也就是说最为准确地反映汉语的发音规则,我觉得还得是国语罗马字方案。
  国语罗马字方案也是迄今为止唯一的一个考虑到汉语声调变化的拼音方案,58年的汉语拼音方案实际上是在国罗和北拉的基础上经过调整形成的一个方案,它不考虑声调变化这一点继承自北拉,但声母韵母组合方案、零声母、空韵(整体认读音节)、i/u/ü介音等元素显然继承自注音方案和译音方案。

2018年1月13日

国罗的复兴

正是由于国罗能够不加音标就可反映声调变化的这一特性,使得它在默默无闻几十年后重新受到人们的重视。过去使用国罗的人大概也就是赵元任和他的学生等一些人,即使是在台湾、海外华人圈里和国外汉学家中,直接使用国罗的人也是凤毛麟角,只有在某些名词翻译的时候才会偶尔用到。毕竟和中国大陆相比,其他地区的汉语使用者还是太少了。不过,在汉语使用的绝对主力地区中国大陆,还是有一些人一直以来对国罗念念不忘,爱不释手,毕竟和汉语一样,国罗的未来也在大陆。
  实际上,国罗从未走远,在我们的汉语拼音无法严格区分名词的拉丁化拼写的时候,我们还是会使用国语罗马字,比如山西『shanshi』(http://www.shanxigov.cn/)
和陕西『shaanshi』(http://www.shaanxi.gov.cn/)
,注意它们的官方拉丁化翻译,山shan和陕shaan的区别采用的正是国罗方案。
  目前在网络上,可以查到不少国罗相关介绍资料,以及一些教学材料和视频,在北大中文论坛、清华大学水木社区以及各大高校中文系师生中,一直活跃着国罗相关讨论,以沈仕文先生为代表的一些社会各界热心人士一直致力于国语罗马字的教学和推广工作,并取得了不少的成绩和成果,在广大爱好者之间和因工作关系而出现的国罗需求者中掀起了一股国罗热,使得国语罗马字在1928年诞生之后达到了应用和讨论的顶峰,这也算是国罗这一汉语拼音方案方面的珍贵礼物的涅磐重生吧。
  另外值得一提的是,国罗的另一个重要应用就是作为一种中文输入法应用到实际生活和工作中去。在汉字输入技术蓬勃发展的今天,相比于形码方案和全拼、双拼等不分声调的音码输入方案,以及注音输入法、微软拼音输入法等声调后置的音码输入法,国罗这套声调与拼写结合的输入方案是最符合中国人的思维习惯的了,网络写手等重度文字工作者一定是感同身受的。国语罗马字也和日语罗马字、韩语罗马字、越南语罗马字构成了汉字文化圈拉丁化译音方案的统一系统。

周有光诞辰 112
周年

The O’s in today’s Doodle flip from Pinyin (Gǔgē) to Chinese characters
(谷歌). Were it not for celebrated linguist Zhou Youguang, this phonetic
translation would never have come to life, and the world would still be
referring to ‘Beijing’ as ‘Peking,’ and to ‘Chongqing’ as ‘Chungking.’

Popularly dubbed ‘the Father of Pinyin,’ Youguang spent three years
developing the system of ‘spelled sounds’ that is now the international
standard for Romanized Chinese. The new system transformed China’s
literacy rate, providing more natural passage into the written language,
which requires mastering thousands of characters. It bridged multiple
Chinese dialects with its shared designations of sound. Today,
schoolchildren learn Pinyin before characters, and it is often used to
input characters on smartphones and computers.

Pursuing his love of language throughout his life, Youguang authored
more than 40 books and translated the Encyclopedia Britannica into
Chinese. Born on this day as Zhou Yaoping, this storied linguist later
adopted the pen name ‘Yougang’ because he wanted to ‘bring light’ to the
world. Today, we celebrate what would’ve been Yougang’s 112th birthday
with a special place in the spotlight.

Doodle by Cynthia Yuan Cheng

Early drafts of the Doodle below

今天谷歌首页动画的主角是参与制定《汉语拼音方案》、被称为「汉语拼音之父」的周有光先生。拼音帮助普及了汉字教育,然而如何正确规范地表达、输入、排印拼音?本站(推特)作者@ryukeikun
从字、体、排、印四个方面做了详细探讨。

Wǒ ài pīnyīn!

By Eric Q.
LIU

| 2017/08/18

六年制小学课本《语文》第一册,人民教育出版社,1987 年(图片来自网络)

大家快来评 (tu) 论 (cao) 一下吧!

不知道从何时起,网上突然开始流行起这样一种写法。在形式上采用了「括号给汉字注拼音」的方式,比如在这句话里,字写作「评论」而实际上却希望被念做「吐槽」。乍一看是给汉字注音,但明显不是汉字原本的读法,自然也就超越了单纯注音的目的。

这种做法似乎是从二次元的世界引入中文的,源头自然是我们一衣带水的邻邦。在同属汉字文化圈的日本,对某个汉字词汇强行指定一个新的读音的做法俨然已经成为一种修辞方式。这一点,大家可以参见笔者在知乎上的一个回答,这里就不展开说了。而今天,我想把重点放在和大家讨论:是时候来重视一下汉语拼音的字体排印了。

配角也重要

现在国内出版的几乎每本汉语字典里,附录都会收录《汉语拼音方案》。仔细一看可以发现,这份方案发布已近六十年。自
1958
年发布当年的秋季起,汉语拼音就进入了全国各地的语文课堂,相信大家上小学时都是从学拼音开始的,这已经是学习汉字的必经之路。毫无疑问,汉语拼音已经深深渗透到了我们的生活之中。中国教育部、国家语委在今年七月发布的《中国语言文字事业发展报告(2017)》中指出,目前已有
68%
的国民掌握汉语拼音。而且,除了初等教育里给汉字注音以外,一般大众很少知道的是,中文的盲文、手旗语以及手语等的标准化,其实都是以汉语拼音为基础的。

《汉语手语字母方案》里用指式代表字母,按照汉语拼音方案拼成普通话,作为手语的一种——指语。

在全球化的今天,不仅十亿中国人在用汉语拼音,外国人也在用。汉语拼音早已经进入
ISO,它是汉语罗马化转写的唯一国际标准。现在,包括台湾在内的汉语人名地名的转写都采用这个方案,它涉及到我们每个人的护照、我们每天走过的道路、每天乘坐的地铁站。现在我们每个人几乎每天都在手机、电脑上用拼音:现在我虽然以「笔者」自称,却早已不再执「笔」,而是在键盘上用拼音输入您现在读到的这些文字。

但是,尽管汉语拼音如此重要,它依然没有得到应有的重视,一直都是屈于汉字之下的「二等公民」,而大家对汉语拼音的认识一直是停留在「学前辅助使用的小儿科」。对拼音的忽视,导致了诸多现实问题:学校里老师备课、布置作业都在为无法方便输入拼音而苦恼;外国友人在街道、地铁里那些莫名其妙的「拼音+英文」杂糅的翻译搞得一头雾水。汉语拼音绝不是小事情,不是「辅助」用,正确的拼音排版是中文字体排印里不容忽略的一项内容

汉语拼音采用的是拉丁字母,所以汉语拼音的字体设计问题,要从西文字体设计的角度出发。在这个全球化交流的时代,当设计界、字体排印界都在探讨所谓「中西混排」时,讨论的对象多是关注中文和西文如何和谐共处,而却忘记了一个更为基本且紧迫的需求:在我们自己的中文内部,就存在汉语拼音与汉字如何共处的问题,而这本质也是一种「中西混排」。就现状来看,汉语拼音的字体排印亟待改善。做好拼音的字体排印,要靠我们大家一起来关注,绝不是外国人的事情。

接下来,笔者就用「字」「体」「排」「印」四个方面分析一下汉语拼音的「字体排印」。了解现状,是为了能能看清问题,而分析出了问题,才能进而解决问题。

分析《汉语拼音方案》本身的优缺点、以及讨论如何修改方案本身远远超过了本文所能涉及的范围。在本文里,笔者仅着重以使用者出发,从「正词法」(orthography)
的规范角度来谈几个重要问题。

标调还是不标调,这是个问题

目前,使用拼音时最大的一个问题是,在能标调的地方随意省略声调。相信大家都知道声调在汉语里的重要性。一个音节由「声」「韵」「调」组成,没有声调就不是一个正常的汉语音节。标注声调可以减少歧义,提高认读效率,相信这是共识。要「完整」标注汉语语音,声调必不可少。

其实,《汉语拼音方案》诞生之前广为使用的「注音符号」(俗称「ㄅㄆㄇㄈ」,bopomofo)在使用时也不会随意省略声调符号。即使相关规范里说声调「可以」省略,这也并不能成为不标调的借口。省略应该只是在迫不得已、无法标注且不引起歧义的情况下的一种变通。现实生活中「大方」地把声调省略掉、「能不标就不标」,这是一种典型的「懒汉思维」。

Beijing hao piaoliang!

——请问「漂亮」的是「北京」还是「背景」?

正是因为不标调,导致「陕西」「山西」分不清楚。本来标调就可以解决的问题,现在反而还要借用
1928 年发布的「国语罗马字」(Gwoyeu Romatzyh) 中上声「双写字母」a
的办法来区别这两个词。其实,如果完全用「国语罗马字」方案,「陕西」应该拼写成
Shaanshi,而把「陕西」拼写成 Shaanxi
这样「一个单词两种拼式」的杂糅,本来只是「不能标调的特定场合下」不得已而为之的一种变通。由于「国语罗马字」知名度明显不如《汉语拼音方案》,导致现在还有各路热心群众前来围观,纷纷向市政、媒体反应是不是写错了。说到底,如果完全按照汉语拼音方案并标注声调,这个问题本来是不存在的。

也许是为了与「国际化」接轨,上海轨道交通的站名似乎是按照英文方式标注。不单是
Shaanxi
的拼法,地名中「东西南北」如何标记都引起过争议。而事实上,如果遵循国家规范,地名都应该用汉语拼音标注。

说到环境,一些人曾公开声称标调字母存在技术问题,「无法在计算机中正确显示和输入,不适应当前信息化、数字化的发展要求」。其实这种论调的本质与「电脑时代的汉字灭亡论」一样,是一种「削足适履」的表现。不能正常显示和输入字符,是因为技术不够;而技术不到位,那就应该发展技术,而不是自残地把一个完整的汉语音节牺牲掉。更何况,标调字母其实也是西方各国在信息化过程中遇到的问题,而实质的技术问题早在上个世纪就已经解决。标调字母无论是在编码层面还是字体层面,都已经得到解决。如果在这个所有主流操作系统都支持
Unicode 的时代,还要拘泥把字符局限在 ASCII
代码里,那显然是用脚决定脑袋的做法。标调字母到现在已经完全不是一个技术问题。

还有一些人说标调字母不好看,又把这个问题一下子提升到了美学的高度。事实上,放眼看看世界的书写系统,并不是只有汉语拼音带声调符号。西欧各种语文里有两三种标调字母是非常普遍的状况。随手翻翻法文、西班牙文、意大利文,碰到
à、é、ü 等字母的机会非常多。无论是肖邦 (Frédéric François Chopin)
还是德沃夏克 (Dvořák)
都可以「名从主人」精确地书写出来。在亚洲,甚至连六个声调的越南文都要求完整地书写,我们又何必对拉丁字母加上必要的声调带着美学洁癖,觉得是「满脸麻子」呢?事实上,很多国外学者为了增加拼音转写的还原度,都会主动在其论文、著作里标注拼音的声调。我们应该把「默认」的状态调整到「标调」的状态,再根据环境进行判断。

Robert Bringhurst 所著 The Elements of Typographic Style
书影。请注意其中提到的《梦溪笔谈》和相关汉语词汇都用了规范的汉语拼音标注,包括声调。

当然,对于日常使用来说,电脑显示、传输标调字母都没什么大问题,而往往会在最初的输入却困难重重,这需要引起输入法开发商的重视。放眼看一下国内各种的输入法软件,宁愿花大量人力开发新功能,让各种复杂的颜文字和表情符号符号做到一键切换,却不愿意把带声调的拼音字符的输入做得再容易一些。其实从技术上来说,开发上并不难,重要的是应该认真重新思考一下开发的优先顺序。

缩写、改写、随意写

除了声调,对于拼音字母缩写、改写、随意写的现象也经常可以看见。而重灾区里最常见的就是韵母
ü
了。从方案制定当初开始,它就一直是一个饱受争议的字母,本质上和声调一样属于标调字母,人们总是避而远之。尽管汉语拼音方案人为地追加了一些拼写规则尽量减少了这个字母的出现频率,但是依然有
nü、lü、nüe、lüe 等四个常用的音节需要把 u
上的两点写出来。直到现在,依然有好多姓「吕」的朋友在办理护照时遇到麻烦,而更多人将电脑拼音输入法
v「键位代替」的方式滥用到输入法以外的情况。这个问题在知乎上的讨论
已经比较充分,大家可以移步参考。

按词连写

西方每种语文都有各自的「正词法」的拼写规范,而汉语拼音也有,那就是GB/T
16159—2012《汉语拼音正词法基本规则》
,而这份文件规定了汉语拼音的拼写原则:「按词分写」。

4.2 以词为拼写单位,适当考虑语音、语义等因素,并兼顾词的拼写长度。

教育部语言文字应用研究所的冯志伟先生在介绍 ISO 7098:2015
修订过程时特别提到,为了向国际社会指出「按词连写」的必要性,分析了汉语拼音的「歧义指数」。比如本文前面举的例子,如果不考虑声调因素,常用字里的音节
bei 有 31 个汉字,jing 可以有 49 个汉字;但是如果按词分写作 beijing
就只有三个单词「北京」「背景」「背静」,如果再按照「将地名大写」的正词法原则,那么即使没有声调的
Beijing 也完全不会有歧义。可见,按词分写可以极大提高认读效率。

当然,国标的正词法规则里也存在灵活处理,制定了「变通规则」。

7 变通规则

7.1 根据识字需要(如小学低年级和幼儿汉字识字读物),可按字注音。

其实,「按词分写」之所以没有普及,很大一个原因是由于大部分人对拼音的学习在初等教育就结束了,而对汉语拼音正词法的学习不足。也正是因为对拼音停留在「识字」的阶段,才会养成「一字一音」「按字标注」的习惯。

从这一原则的贯彻实施来看,只有在印刷行业里的老牌出版社里还是执行得很不错,到了其他领域,从实体世界的路牌地名到网络空间的人名注音,需要改进的地方还非常多,普及工作亟待加强。

「字」是所有字体排印的基础,正确、切实理解「字」的需求是进行字体设计、排印的前提条件。我们要了解到一些最基本的要求是有一定「刚需」的(比如写对字母),而一些要求则是有「原则」又有「灵活处理」处理的(比如根据条件标注声调)。简单一句话,既然要写汉语拼音,就要「遵照规范」「正确」地写。

汉语拼音采用的是西文,正如《汉语拼音方案》本身就明确写道「字母的手写体依照拉丁字母的一般书写习惯」。那么印刷体怎么办?似乎沿用普通西文字体本身没有什么大问题,但在实际应用中有三个问题特别突出,即「字母
a/g 字形问题」、「字宽问题」和「声调造型问题」。

字母 a/g 字形问题

西文字母 a/g
的字形设计有两种形式,也就是所谓的「单层」「双层」问题。从字形起源来看,双层的
a/g 偏向印刷,而单层的 ɑ/ɡ
偏于手写。在西文的字体设计里,这原本仅仅是一个单纯的设计取向问题。比如在有一些字体(如
Perpetua)在罗马体采用双层字形,在意大利体采用单层字形;而一些几何形无衬线体(如
Futura)里,字母 a/g 根本就不存在双层造型,只有单层的造型。

各款西文字体的罗马体和意大利体,采用单层还是双层字形,都由设计师自主决定,相对比较自由。

那么,原本应该沿用西文造型的拼音,又是什么情况呢?可能是出于拼音在初等教育的需要,为了方便小朋友识字认读,在中国国内发行的书籍里经常可以看到在用普通罗马体排印拼音时,本来可以用正常的双层
a/g 字形,却煞费苦心地换字体或者加入混排强制改用单层 ɑ/ɡ
的情况,结果自然是失去了字体的一致性,令这两个字母显得格格不入。

更有甚者,中国国内的一些字体产品(如 Mac
系统自带的由华文出品的「宋体-简」、华文仿宋等)的西文部分,会在原本安放双层
a 的码位上强行安上一个单层 ɑ 的字形,以「方便」用户输出。

中国国务院发布《通用规范汉字表》的官方文件里采用的拼音字体就是强制单层的
ɑ/ɡ,与前后字体非常不协调。

笔者参与编辑的
W3C《中文排版需求》里就明确指出:

3.3.4 罗马拼音标音的排版

注文常用较细、较饱满的无衬线体。出版与教育界普遍认为汉语拼音排版必须使用
a 与 g
为单层设计的、二声调号下粗上细的字体。但其实没有任何国家标准对汉语拼音的字体及字母形态做出过具体规定。

台湾中华文化总会曾去信大陆教育部询问汉语拼音字形相关事宜,大陆教育部响应表示,汉语拼音字母
a、g 对应相应的拉丁字母,呈现方式不需拘泥于手写字形。

也就是说,完全没有必要过分敏感地在使用拼音时避免双层 a/g
字形。汉语拼音从制定的第一天起就是要向西文看齐的。直到 80
年代为止使用铅字印制的出版物,包括国家关于语言文字的各种规范文件,使用的都是双层字形的
a/g
印制拼音。目前中华人民共和国教育部的官方网站上发布的《汉语拼音方案》,也使用西文罗马体一样的双层
a/g 字母印制。

1965 年发布《印刷通用汉字字形表》时采用的拼音字体里字母 a/g
都是双层的正常西文字符。

在初等教育的教材里为了识字、认字的需要,汉字采用的是更为接近手写的楷体,那么拼音的确可以采用接近手写的意大利体,或者类似手写字形的无衬线体。但是这种字形没有必要扩大范围到进入到罗马体里去。在普通宋体的附属西文里强制植入单层
ɑ/ɡ
可以说是一种「矫枉过正」,这与一些宋体楷化的错误思路如出一辙。这样的结果,至少会导致两个严重问题:

首先,造成拼音内部的设计不尽统一。有些字体只把标调字母制作成单层
ɑ,而不带声调的保留双层
a,人为地造成内部的字母造型不一致。由于汉字的轻声依然需要不标调的字母,这样的字母拿出来和四个标调字母并排起来简直就是两款完全不同的字体。

其次,字体内部「字形」与「编码」的映射逻辑混乱。实际上,单层 ɑ/ɡ
的字形在国际音标等场合是需要与双层字母进行严格区别的,因此 Unicode
编码里其实已经给单层和双层字母分别赋予了不同的码位。字体厂商应该规范地把单层和双层的字形按照
Unicode
的要求分别映射到各自的码位上,否则就会出现「张冠李戴」或者二者混淆不清的情况。强制在双层
a 的码位上放置单层 ɑ
字形,违背了字符映射的逻辑。使用这些字体的结果是,无论输入单层、双层字符的编码都只能显示单层字形,虽然「暴力解决」了拼音单层字形的问题,但却导致中西混排时西文的效果极其怪异。

在设计上,「楷体」比「宋体」更接近手写,更可能采用单层 ɑ
字形,但各个厂商的实际产品却不尽相同。多数沿用了普通罗马体设计,只有少数字体重新为楷体设计西文。而最糟糕的还是四声带调的字符与轻声不标调的正常西文字符
a
字形上单双层不统一,导致五个音节并排一起时效果怪异。华文的「楷体-简」通过修改字形映射「暴力解决」统一用单层
ɑ 显示,却导致正常的西文显示效果怪异。Kai Regular
虽然在字形上统一了,带调字母却是全角宽度,给用户凭添了另外一种困扰。

字宽问题

笔者在前文《「中西之别」重考》里指出过,西文字体设计与汉字最根本的不同,在于西文字母是以「变宽」为原则设计的。汉语拼音采用拉丁字母,因此也应该和西文一样是变宽,或者「成比例」(proportional)
的,标调字母也不应该例外。

目前,中国国内有很多字体厂商字体里附带的拼音,所有标调字母的各种量度
(metrics)
都采用和汉字一样的所谓的「全角」宽度。而同一款字库里配的西文却又是比例字体,用这样的字库排一个正常的拼音音节,却俨然成了「混排」,不仅效果上看起来不统一,看起来完全不像是同一套字,而且导致字距、词距分不清,基线高高低低,引发严重的易读性问题。这样的配置同时还引发了一个「副作用」,就是混排在中文里一些带调字母法文、意大利文也收到连累统统变成了全角,常见词汇如
café 或 caffè 夹杂在中文里面都不能令人放心。

采用中文字体附属西文的一个陷阱就是带调字符会按照拼音全角宽度字形显示。

采用这种实作的原因,应该归咎于国内某些字体厂商守旧偷懒的思维。因为守旧,所以把标调字母当做「符号」,一律制作成全角宽度,完全忽视其西文的本质和实际用途;因为偷懒,自认为这些标调字符不重要而不重新设计,在开发新字体时只顾制作汉字部分,包括拼音甚至标点符号等非汉字字符「能不做就不做」,把其他字库里的默认字形直接拿来凑数。

的确,汉字的字符集非常庞大,字符数量动辄六七千甚至一两万。但是作为一款字库产品,对里面的字符应该一视同仁,而不应该「挑活干」,随便自己判断某些字符不常用就不做。这种现象堂而皇之地出现在被放在厂家列为「精品字体」的产品里,有一些甚至还是国内某些设计奖的获奖字体。这样的字库产品,从根本上却违背了一款字库要在指定的字符集里「不缺字」的基本要求,损害了活字这一工业产品的泛用性。而作为一款声称「符合国标规范」「符合
Unicode
规范」的字库产品,却在字形映射上犯错导致错字、在码位上偷懒、在字符上「挑活」,这甚至都有夸大宣传、欺骗用户的嫌疑了。

国内外主要厂商的拼音字形比较。国内厂商的「全角」字形问题严重。

声调造型

下面从纯粹的字体设计的角度来看一下汉语拼音声调符号的造型设计问题,其实主要也就三个方面:形状、长度和位置。

形状方面,争议最大的就是「阳平」(第二声)如何设计的问题。在西文里,(´)
这个符号本来应该称作「锐音符」(英语称 acute accent;法语称 Accent
aigu),在法文、意大利文等文种里用来标记高元音,而同时还有一个与其相对的「钝音符」(`)
来标记低元音——这一对符号的目的是为了区别不同的发音,而书写时一般都是从上往下写,只是锐音符是往左划(撇),钝音符是往右划(捺)。

锐音符也被其他语言借用,但是功能却不一样。比如在西班牙语里用来标注重音,并不存在钝音符的字母与其对立;而在捷克文、匈牙利文里用来表示长音;波兰文、克罗地亚文等文种甚至将其标在辅音字母上用来表示腭化辅音。

到了汉语,我们把这个符号借用过来,不是用来区别元音,而是用来表示声调。而无论是在「注音符号」还是《汉语拼音方案》,中国人所习惯的「阳平」声调是一个从低到高的一个上升调(用语言学的「五度标调法」是
35),因此绝大多数人的书写方式都是从左下到右上的「提」,刚好和西方人的写法相反。

一方面,《汉语拼音方案》说字母的写法要遵循一般西文的习惯,而另一方面,中国人在阳平声调上的习惯却明显和西文习惯相反。这就造成了目前字体设计里的站队问题:国内厂商设计的字形,都是左下粗、右上细「提」;而一般西文的设计都是右上粗,左下细的「撇」;当然还有一些少数「骑墙派」,即类似无衬线/黑体/等线体的字体(如「圆体-简」)故意不区别粗细。对于用户来说,到底要选哪一种,的确是很伤脑筋。

几款西文字体带调字母的比较。声调符号的易认性与衬线/无衬线并没有必然联系,而完全取决于设计师。在衬线体里也有类似
Goudy Old Style 这样难以辨认的字体,而无衬线体里也有 Helvetica Neue
这样相对容易辨别的字体。

另外,声调的长度和位置也是设计的一个重要细节,往往一些微妙的变化会对声调的易认性造成很大影响。一个很明显的例子就是,本来拼音就是放在行与行之间,往往字号本来就很小,而在小字号的状态下,阳平(第二声)和去声(第四声)如果写的太短、倾角不够,就不容易分辨而造成误读;而粗细对比过小、倾角过小的上声(第三声
ˇ )也容易与阴平(第一声)甚至和中文声调毫不相关的「短音符」(˘) 混淆。

声调造型的易认性问题,在西文无衬线体、中文黑体里更为严重。比如有一些常用的西文字体(如
Arial)里 i、í、ì
在小字号下就不很容易分清楚。字体设计师需要特别注意这些细节,比如可以在长度、位置上加以调整,以便于读者分辨。在这一点上,原本就需要变音符号的法文铅字相对就表现得比较出色。比如对原版
Garamond 铅字进行了忠实数码复刻的 Garamond
Premier,里面的标调字母形态修长,易于阅读,也富有美感。而现代无衬线体的代表
Helvetica 在翻修制作成 Helvetica Neue
时,不仅拉长了符号,还对位置进行了视觉调整,提高了字母的辨识度。

Helvetica 与 Helvetica Neue 的对比。请注意声调符号及位置的变化。

其实,早在铅字时代就已经存在「拼音专用字体」了。比如在这张 70
年代制作的样张里,我们可以看到所有字母遵循了西文的比例宽度,并在标调字母上为拼音进行了优化:为了保证声调的易认性
(legibility),标调字母如 í/ì 比字母 i
不仅加大了宽度,声调的位置也进行了拉伸,比如阳平(第二声)左下的起笔位置,并不是像一般西文那样在
i
字干的正上方,而是向左偏移一些,这样可以使声调笔画更长、空间更为富裕。电脑字库的「圆体」似乎继承了这款铅字的一些特征。但总体来说,与西文字体设计相比,国内厂商在字形设计方面还需要多加努力。

拼音排版示例:以拼音为主,字注音,拼式与主字居中对齐,正文疏排。(曹洪奎编著,《活字排版工艺》,1979,轻工业出版社)

在展开谈拼音排版之前,首先要强调一点:如果是拼音的单独排版,应该沿袭西文排版方式,包括标点符号、对齐方式、换行时的「连字处理」都应该按照西文排版的习惯,在此就不一一具体展开。下面我们来重点谈一下拼音与汉字混排的方式。

与汉字混排的拼音排版,首先要对位置、字号、主次关系等排版要素进行决策。

一、位置

拼音可以作为「行内注」,通常是用括弧加注的形式放到一行的中间。这个位置的优点是对现行排版的影响最小:排版规则遵照中西混排的原则即可,遇到竖排时和西文一样直接旋转
90
度躺倒。但缺点则是违背阅读的单一行进方向——读者的视线需要折返,因此一般仅限于面对高级读者、对少数词汇的注释,而在初等教育、大量注音里非常少见。

拼音更常见的是「行间注」,即把拼式放到行的外侧。中国内地多为横排,因此在绝大多数情况下都是把拼式放在主字的上方,而事实上其他地区(比如日本)也会放在主字的下方。如果竖排,拼式多放在右侧,很少放在左侧。不过由于竖排时拼式要和西文一样旋转
90
度躺倒,并不非常适合阅读,因此实际上竖排的拼音非常罕见。可见,拼式相对主字的位置是比较灵活的,只需要根据阅读习惯提前做好决策好就行。

作为面向留学生的「中高级汉语选修课教材」,正文里拼音的排版采取了两种不同的策略:页面上方整句的长篇拼音按照西文方式抽出来单独排版,与汉字对照并排;页面下方的部分汉字注音按照混排方式,行内括弧形式夹排。——《轻松汉语正音课本》,北京语言大学出版社,2003
年。

采用「行间注」需要在行与行之间多添加一行拼式,这就会对正文的版面灰度会造成很大影响,在设计上需要仔细决策。通常情况下,拼式与主字的「行距」默认是
0,即紧靠主字的字框。但在一些特殊情况下,可能还需要对拼式与主字的距离进行微调,特别是当拼音字体的基线位置过高或者过低时。很显然,如果把拼式与主字之间的距离拉得过大,会导致拼式看起来浮游在两行文字之间,导致分不清归属于哪一行,这是绝对要避免的。

二、字号

从排版角度来说,字号不可能存在一个硬性标准,而需要根据使用目的实际考虑。但是目前很多环境,无论是网页、还是排版软件,都会默认把拼音设置为「主字字号的一半」。这样的设定对于汉语拼音来说,是否合适呢?

把注音字号设为「主字字号的一半」,这其实源于日本的排版规范。日文在铅字时代就习惯使用七号活字
(5.25 pt) 为正文的五号字 (10.5 pt)
注音。由于假名和汉字一样基本设计都是方块字,加上日文的汉字读音以两个假名居多,「一个主字配两个注音字」的习惯被沿袭下来。日文里非常频繁地需要为日本汉字用假名注音,注音对于日文字体排印是必须的一个项目,因此日本很早就在各个排版环境里对注音排版进行了研究,并从早期开始就实现了支持方法。目前绝大多数的排版环境都会默认使用日文排印的设置。日本工业标准
JIS X 4051 《日语文书的排版方法》里中明确写道(笔者试译):

4.12 注音处理

4.12.1 注音字的字号:注音字的字号,规定为主字字号的
1/2。但是,给大字号标题注音时,可以小于主字字号的 1/2。

注 1:本规范允许西文用字、连数字等注音用字可以拥有其固有的字宽。

而另一方面,在依旧使用「注音符号」的台湾,其教育部门编印的《国语注音符号手册》里附有「国字注音比例参考图」,里面规定注音符号的尺寸大约为主字的三分之一。这样的规定也相对合理,因为根据注音符号本来就是按照汉语传统音韵制定而成,其拼式长度,最短是一个字符,最长也只可能是「声母+介音+韵母」的三个字符。

各个文种里的注音机制及排版规范实例;日文注音假名、繁体中文注音符号、简体中文汉语拼音,目前只有汉语拼音没有具体明确的排版规范。

那么,汉语拼音怎么办?

汉语拼音采用西文。即便是在同样字号下,西文字符也会比方块字显得小。在中西混排时,设计师经常需要把西文的字号放大、基线调高。实际上,如果采用默认诸多排版引擎里的「二分之一」的默认设置,汉语拼音的拼式会显得过小,特别是声调难以阅读,损害读者视力。因此,从字形设计上看,需要在二分之一的基础上调大一些。

其次,汉语拼音的拼式长度不像「注音符号」相对固定,导致无法对字号做出统一的硬性规定。由于在制定汉语拼音时,按照西文的习惯遵循了「一音素一字母」的原则,因此在沿用拉丁字母表、不生造字母的前提下,采用了一些双字母设计,结果导致汉语拼音的音节,短到一个字母,长可达六个字母。而另一方面,西文字母本身就是比例宽度,并不是像汉字、假名、注音符号那样是等宽的,因此每个单字的拼音长短变化繁多,「变长的拼音拼式」与「定长的汉字字宽」存在根本的对立。再加上拼音正词法规定「按词拼写」,一个汉语词汇可能有三四个汉字,这样拼式的浮动就会比按字分写的变动幅度要大很多。

汉语拼音的拼式长短不一。数字代表字母数。由于西文采用等宽字符,拼式长度与汉字字数没有固定关系(如「自给自足」四个汉字拼式却很短),与字母数量也没有关系(八个字母的拼式长度可能比五个字母拼式还短)。

因此,汉语拼音并不存在、也不可能像「注音假名」「注音符号」那样有相对简单、严谨的排版规则,而应该灵活处理。那么,拼音真的就没有规范了吗?回答是否定的。在中国国家标准
(GB) 里,有一个规范对使用拼音最多的场合做出了限定——中小学教科书。

现行国标 GB/T 18358-2009
《中小学教科书幅面尺寸及版面通用要求》
里虽然明确规定小学一、二年级应使用二号
(21 pt) 或三号字 (16 pt),却没有提到拼音的字号。反而是 GB/T 17227-2014
《中小学生教科书卫生要求》里有明文规定:

6.6 拼音、阿拉伯数字和字母高度

小学一年级不宜低于 3.5 mm;二年级不宜低于 3 mm;三、四年级不宜低于 2
mm;其他各年级不宜低于 1.5 mm。

同样是关于中小学教科书文字排版的规定,却同时出现在两个不同的国标里,而且两份国标内容还有一些冲突,这本身就是一个很大的疑问,不过这已经超出本文讨论范围,暂且不提。GB/T
17227-2014
本身作为「卫生要求」,里面居然还有「各字号尺寸」的定义,不禁让人有一点过于跨界之嫌。其正文里也没有像
GB/T 18358-2009 那样采用印刷行业常用的「号」、「点」(point)
为单位,而直接采用毫米,让实际操作起来有点复杂。为了方便一般读者理解,笔者暂且把前面
5.6 规定的数字粗略换算后改写如下:

小学一年级不宜低于 10 pt;二年级不宜低于 8.5 pt;三、四年级不宜低于 5.67
pt;其他各年级不宜低于 4.25 pt。

可见,当二年级教科书正文使用三号字 (16 pt)
排版时,如果单纯按照默认「二分之一」的设置,拼音将会变成只有 8
pt,就会低于国标规定的下限。因此关于拼音字号「二分之一」默认设置并不是万能的,一定要根据实际情况进行调整修改。

三、主次关系

拼音既然是用于标注,因此就需要处理好被标注文字(即「主字」)与拼音之间的「主次关系」,而这也需要根据目的进行策略考量。

正如上文所说,拼音排版的实质是中西混排,而其本质与汉字排版是不可调和的,那么我们在策略上就必须先承认这种不调和性,确定优先顺序,在妥协中求平衡。如果以汉字为主,那么应该按照中文网格的中式排版,让拼音依附于汉字版面;如果要以拼音为主,那么就应该按照拼音的易读性,而让主字依附于拼音的版面。根据不同目的采用不同的手法。我们不妨来看看一下排版几本书的实例。

按字注音,拼式与主字居中对齐,正文疏排,课文无明显对齐网格,读物的诗歌有对齐网格。——九年义务教育教科书《语文》一年级上册,人民教育出版社,
2016 年版。

对外汉语教材一般以拼音为主,汉字为辅,甚至连主字正文和拼音一样「按词分写」。在保证拼式间距合适的基础上排汉字。但即使这样,依然以像日本的汉语教材一样以「稿纸模式」的对齐网格为参考,这样能让版面乱中有序。

而国内的初等教育一般以汉字为主,拼音为辅。因此,首先要对汉字的排版进行扎实的设计考虑。本来就是以汉字为主,而汉字排版本身又很混乱,加上拼音后只能是乱上加乱。上述几本中国国内的出版物,包括
2016
年最新版的小学一年级《语文》教材,在中文排版上都存在着一些尚可商榷之处。如果能根据汉字「稿纸模式」的对齐网格为参考,在考虑拼音长度的基础上设置一定的疏排间隔,就能排出更整齐、稳定的版面。

解决整体版面之后,我们再来仔细考虑一下细节:拼式和主字到底应该如何对齐?Word、InDesign
等软件的注音功能里默认设置了一种所谓的「1-2-1
对齐方式」。这个名称看起来有点莫名其妙,其实此方式仍是源自 JIS X 4051
《日语文书的排版方法》。由于很多排版软件主要针对的是日文功能,因此把这个方式设置成了默认。这个方式的本质,依然是源于前面阐述的注音假名与主字之间二分之一的字号比例,显然不适合于汉语拼音。事实上,该
JIS
正文也明确指出,虽然对「注音假名」推荐使用「1-2-1」原则,但如果注文是西文,应该按照「西文固有宽度密排之后居中排版」。将所有注文都照搬「1-2-1」原则,也是对
JIS 规范的一种「美丽的误会」,毕竟 JIS
规范本身就不是强制、而是推荐性质的。

JIS 式 1-2-1 对齐方式图解

实际上,无论是按字拼写还是按词拼写,由于汉语拼音的拼式长短不一,因此在实作中,几乎所有出版物都采用了「拼式与主字居中对齐」的做法,这是比较务实的。笔者也推荐大家默认使用居中对齐,再进行局部调整。

另外,在决定使用「按词分写」时,还需要注意几个特殊问题:

按词分写会影响换行位置。虽然拼音本身可以用连字符根据音节转行,但这样的机制明显会提高排版引擎的复杂度,因此很多软件为了简化算法,在判断能否换行时,会把整个注音的词组作为一个「不可分割」的文字块进行处理,因此这就会造成该行和下一行内部分别要进行额外的词距调整。这个问题在「按字注音」是相对不明显,而在「按词分写」时就会凸显出来。

拼音在排印时基本应当使用西文的标点符号,特别要注意「隔音符号」应该使用半角宽度的缩略符
(’),字形上应该与普通西文里的「后单引号」一致,该符号前后的间距以及是否能换行的原则也要注意。

Word
的「拼音指南」为了简化算法,必须按词组整体换行。而此例中发生了分词错误,第二行的「中文」没有被当做一个词而是作为两个单字分别注音,而偏偏「中」字的拼式很长,占据了太多的空间,因此只好把「思维」推出到第三行,这样导致了第二行富余出很多空隙,算法只好加到了标点符号处。通过手动修正把「中文」当做一个词组注音之后,第二行腾出了足够空间放置「思维」一词,换行位置的改变使整个版面灰度了发生很大变化。

从一般论来说,在讨论排版时通常要从两个角度进行考虑:易认性和易读性,而拼音的排版也不例外。在易认性方面,要注意拼音字号大小是否合适、与主字的行距是否恰当等等;而在易读性方面,要注意是否需要按词分写、大小写、换行和标点问题。

这里的「印」指在媒介上的各种呈现。上文已经举了金属活字时代的排版实例,现在我们来具体看一下数码时代如何实现汉语拼音的排版。

首先从 Unicode 的字符层面来看,在国际标准 ISO 7098:2015
《信息与文献——中文罗马字母拼写法》(Information and Documentation:
Chinese Romanization)
里,第七章中明确指定了《汉语拼音方案》里四声所用字符的编码应当采用「组合用区分符」
(Combining Diacritical Marks) 区块里的字符,即分别为 ̄ U+0304、 ́ U+0301、
̌ U+030C、 ̀
U+0300,之所以使用这个区块,明显目的是用来与其他字母组合使用。这与注音符号指定的四声选用「进格的修饰字符」(Spacing
Modifier Letters) 区块的决策截然不同。之后,在该标准「附录
B」里指定了带调字母的码位。附录 B
的性质是「规范性附录」,因此它属于标准的规范性技术要素之一,是标准正文的附加条款,效力和标准正文一样是要执行的。

支持汉语拼音所需要各种带调字符。由于正词法的需要,大写字母是必须。除了两个音节(n
的阴平、m 的上声)以外,所有罕用音节都被《现代汉语词典》收入。

这里需要对 ê、m、n
这几个「罕用音节」做一下补充说明。在中国相当权威的中型字典《现代汉语词典》里,音节
ê 的四个声调 ê̄、 ế、 ê̌、 ề 全部收齐,但是 m 音节没有上声,n
音节没有阴平。与此相比,现行中国大陆的强制国标 GB 18030 里有为 n
音节的三个调编码,m 音节仅有阳平的 ḿ,缺了阴平和去声;而 ê
音节完全没有四个带调字母的符号。而且,如果从「完整性」的角度来说对
ẑ、ĉ、ŝ、ŋ 这几个罕用的代用字母支持也不够。

从 Unicode
的角度来说,带调字母由于存在「组合用字符」机制,因此涉及到规范化和等价判断问题,这部分内容也显然超出了本文的范围,对技术细节感兴趣的读者可以参考笔者主持的播客节目「字谈字畅」第
52
的内容。虽然目前
Unicode 已经定义了大量带调字符,但 Ê̄ê̄、Ê̌ê̌、M̀m̀
这几个带调字母没有独立码位,需要另外用组合序列来表达。另外,尽管 GB
18030 与先前的 GBK 编码是向后兼容的,但是这两份文件里有 95 个字符的
Unicode 参照码位发生了变化(具体可以参照 GB 18030-2015 的「附录
E」),其中就影响到了 ḿ 和
ǹ,因此会有一些输入法和字体文件根据不同文件的码位定义而无法互相匹配,造成无法正确输入、输出这两个音节。

接下来,在数码字体方面,最低限度的要求是需要字体厂商绘制正确的字形,并映射到正确的
Unicode
码位上。「正确的字形」,包括上文提到的阳平声调如何处理,目前国内厂商和国外厂商没有取得一致意见;「正确地映射」,包括上文提到的单双层
a/g
的正确码位的问题。而满足这两点仅仅是过了「合格线」。作为一款数码字体,下一步应该看其是否美观、搭配、好用,这些才是各款字体设计能发挥的空间,而字符宽度、位置等设置的要点也在上文提到了,不再赘述。

在实际操作中,国内外的一些字体厂商往往会以「Adobe
拉丁字符集」的定义进行字形制作,一些字体甚至还声称「由于支持了 Adobe
Latin
4

全部字形,由此支持汉语拼音」的论述。但是如果从严格定义来看,由于 ISO
等国际标准里省略了「罕用音节」,Adobe Latin 4
对拼音的支持也不包括罕用音节,并不能称得上是完美支持。

谈到字体产品,这里就不能不提到一类特殊字体:「拼音字体」。一些字体厂商把拼音和汉字一起当做字形放到字体文件里。用户只要换使用这种「拼音」字体就可以得到带拼音的效果。但是这类字体有很大的问题,应该尽量避免使用,主要原因有:

语义不正确:拼音的信息当做矢量图像被绘制到了字形中,而不是当做文字信息存储、传输,导致编码和字符映射逻辑混乱,信息不明确,也很难被检索。

多音字问题:汉字有一些多音字,比如「行xíng」「行háng」在这类字库就需要分别造字,让用户分别挑选。而实际上这个汉字的码位只有一个,所以需要占用私有区代码,让用户额外为多音字手动调配。

拼音的字宽问题:如前文所述,拼音作为西文,其不定长的特性与定长的汉字字宽之间存在不可调和的矛盾。而在拼音字体里由于是汉字为主,就只能牺牲拼音,以最长的拼式(如
chuang)为标准,对字母强制挤压,字母显得过于修长,影响显示效果和易读性。

以汉字为单位,这样的拼音自然无法「按词分写」,无法满足特定需求。

无法对拼音进行编辑,比如无法将拼音设置成与正文不同的颜色,无法单独调整拼音的位置等等。

「方正楷体拼音字库」例字

一份稳妥的决策指南

面对各种各样的汉语拼音排版问题,数码时代的用户应该怎么办?到底有哪些设计决策要素需要考虑?笔者做了如下总结:

拼音字母:对「拼音字体」的选择要尤其慎重。选用合理的字体,确认要点包括:所有带调字母是否齐全不会缺字、a/g
字母造型是单层还是双层、字母是否为比例宽度、声调符号是否足够清晰易认、阳平调号是中式还是西式、风格与正文主字是否搭配等。在绝大多数情况下,支持大字符集的西文无衬线字体可能要比普通中文字体会更为胜任。

拼式的位置:「行内注」按照中西混排用括弧,而「行间注」时最常见的是横排主字之上,偶尔有横排主字之下、竖排主字之右,原则上紧靠主字字框。特别注意主字文章横竖的排版方式、行距的调整对拼音的影响。

拼音字号的大小:不盲目使用软件默认,而是认真测试。绝大多数环境下,正文里的默认设置是按照
JIS 的「主字的 1/2」,而台湾教育部规定注音符号默认约为主字的
1/3,这些设置往往都不适合汉语拼音,需要调整。建议拼音字号应该比主字一半再大一些,以
55–60% 为基准进行调整。

拼写方式按「字」还是按「词」:初等教育的材料多是「按字」,而按照正词法应该「按词」。注意这个决策对正文的版面效果影响非常大,需要特别慎重。无论是哪种拼式,笔者都推荐正文要使用中式网格的「疏排」设置,为拼式预留出空间。

拼式与主字的对齐:不建议采用日式 1-2-1
方式,原则上选择「居中」,再局部进行调整。自动两端对齐拉伸字间距的做法严重影响阅读,不推荐。

拼式过长的特殊处理:允许过长拼式悬挂到相邻其他主字上,也允许对主字间距调整。因此,在行内需要考虑是将主字撑开、以何种比例间距撑开去配合拼式,还是将拼式悬挂去迎合主字的排版网格;而如果过长的拼式出现在行头、行尾时,需要考虑是将拼式「推出」(即拼式悬挂)还是「挤进」(局部改变拼式的对齐方式)。

拼式的颜色:是否需要与正文区别处理。

排版示例:当拼式过长时,可以在行头放弃与主字居中对齐的格式而将拼式「挤进」(即临时改为左对齐)、也可以在行尾坚持与主字居中而进行「拼式悬挂」的效果。

无论做任何设计项目,都需要先明确目的,之后进行认真测试后选定排版工具。目前在电子文档处理方面,具备汉语拼音注音功能的常用软件有微软的
Word、苹果的 Pages 和 Aodbe 的
InDesign,那么我们可以结合上述需求简单做一下这三款工具的比较。

排版需求项目序号PagesWordInDesign

2 与主字位置与距离不可更改可以更改可以更改

3 拼音字号调整不可更改可以更改多种微调方式

4 按词按字可以手动可以手动可以手动

5 对齐方式固定两端对齐不可调整默认 1-2-1 可以调整默认 1-2-1 多种调整方式

6 超长处理不能调整不能调整多种调整方式

7 拼式颜色不能更改不能更改可以更改

从表格内容可以看出,目前 6.2 版的 Pages
虽然有「拼音指南」功能,但是功能贫瘠,特别是拼式与主字默认两端对齐的方式不能修改,通篇注音的效果只能说是「惨不忍睹」,因此只能推荐在长文中个别字词的注音使用。而
Word
的「拼音指南」功能提供的选项就多一些。虽然可能会对正文的分词判断出错,但是可以通过手动修正。而作为专业级排版软件
Adobe InDesign
提供了最为强大的排版功能,但是也导致设置过于复杂,难于理解,而且拼音文本本身却需要手动输入,而不能自动输入。

Pages 中「拼音指南」功能匮乏,堪称鸡肋。

在Zài网页wǎngyè排版páibǎn方面fāngmiàn,由于yóuyú日本Rìběn的de推动tuīdòng,很hěn早zǎo就jiù开始kāishǐ了le对duì注音zhùyīn的de支持zhīchí。早在
2001 年发布的 IE6 浏览器率先就已经部分支持注音,而后 W3C
发布了「注音」(Ruby
Annotation)推荐规范
并将其写入
HTML
规范
中,导入 
系列标签进行标注,而排版则可以采用「CSS Ruby
排版模块第一级
」的规范内容进行控制。

在使用  标签制作 HTML 时应该注意两点:

为实现上述需求「4. 按词拼写还是按字拼写」,应该使用 
标签,根据需要把相应的字或者词标注出来。比如按字拼写的「字Zì谈tán字zì畅chàng」和按词拼写的「字谈字畅Zìtánzìchàng」。

为保证向后兼容,建议用  标签加上括弧,这样可以保证在不支持 
标签的浏览器里,让标注文字从「行间注」回退到带括弧的「行内注」的状态。因此,使用 
的实际代码看起来会比较繁琐,但是,详细的标注意味着在 CSS
里可以精准地控制,还是值得的。比如,实现「孔雀kǒngquè」的实际代码是:

孔雀(kǒngquè)

目前的这种基本机制对于汉语拼音是否可行、充分,其实还有很多细节问题需要探讨。大家可以认真观察一下上一段文章的实际显示效果,特别是浏览器在渲染时,针对不同长短的拼式对主字字距的控制情况。正如按前文所述,汉语拼音的排版,在本质上与注音假名、注音符号有很大的不同。这一切首先需要通过提出汉语拼音的「需求」来进行。一些基础工作要继续在《中文排版需求》里加以细化,提交到
W3C 等组织上讨论;之后需要不同厂商的各个浏览器环境加以支持。W3C
与文字相关的各种规范,包括电子书、视频字幕等领域的显示、排版问题都在积极有序地进行,而对汉语拼音的支持也需要提上日程。

截止至 2017 年 8
月各大浏览器对「注音」的支持情况。绝大多数常见浏览器都有「部分支持」,但只有
Firefox 支持最全。

结语

2016
年,来自中欧的几位字体设计师联合发起了一个叫「昆虫计划」的项目,从其全称「昆虫计划:中欧语言里变音符号设计的问题」(The
Insects Project: Problems of Diacritic Design for Central European
Languages
)
就可以知道,这个计划研究的是这四个文种里带调字母的设计的问题。其成员包括来自波兰的
Agnieszka Małecka 和 Zofia Oslislo,来自斯洛伐克的 Palo
Bálik,来自捷克的 Filip Blažek,还有来自匈牙利的 Robert
Kravjanszki,而「昆虫」这个名字源于成员内部的一个玩笑:这些字母上的声调就像是在页面上爬行的一群昆虫。

波兰、斯洛伐克、捷克、匈牙利等四国设计师于 2016
年联合发起的「昆虫计划:中欧语言里声调设计的问题」,旨在呼吁字体设计界对这些带调字符的关注。(图片来自项目官网

在国外,各国设计师都在为本民族语言的字体排印不断地进行深入研究,让设计精益求精。正如我在前面「稳妥的决策指南」中指出的,现在非常无奈的一点是,对于拼音的排版在选字体时,我所能给出的建议是还是「能用西文尽量用西文字体」。这一点毋庸置疑,靠谱的西文字体甚至还有意大利体可以用,能为设计师提供更多选择。本来属于我们自己的汉语拼音,目前却没有引起足够的重视,现在很多条件下是靠西文的字体和日文的排版机制来支持。当然,令人可喜的是,在中文字体里也出现了类似「汉仪新人文宋」这样相对足够可用的字体产品。我们期待有更多的中文字体能更正确、更丰富地支持我们自己的汉语拼音。

我曾经遇到一位对中文一无所知的美国朋友,他的一个朴素问题就是一个一个的方块汉字如何能输入电脑;而当我告诉他我们有汉语拼音输入法,而且小学识字之前都要先学汉语拼音时,他却非常吃惊:在学习你们自己本民族文字之前,却要先学习一套外来民族的文字!

的确,使用汉语拼音最多的是教育部门,因此需要真正从现场多发声、提需求,这才是从本质上提高汉语拼音字体排印的一种方式。现实生活中,有许多小学语文老师和大学里的对外汉语教师对汉语拼音非常苦恼,他们很难制作出符合规范的汉语拼音电子教学材料,甚至只能靠手写或自己造字,这非常不便于教学。教育环节叫苦,苦的是教师,最后接受这些损失的,则是我们的孩子,最后还是回到我们自己身上。毕竟,汉语拼音对于所有人,包括我们的孩子以及兄弟民族以及外国友人都是需要的,这种需求是必要而持续的。

汉语拼音采用了拉丁字母,这是我们中文内部使用场景最为需要的「中西混排」。在本文里,笔者阐述了目前汉语拼音的实际字体排印中存在的诸多问题,但本文并不想提供结论,而是想引发设计界更大的讨论。国外的设计师已经动起来了,我们自己的拼音也应该多努力。对于普通设计师来说,了解现状非常重要,只有这样才能为自己的作品慎重选择最优的方案。设计师必须通过测试,找到安全线和妥协的底线。但是,字体排印是一个系统工程,除了设计师,还需要用户提需求、需要专家制定规范、需要字体厂商、浏览器厂商的支持,只有通过各方面的共同努力,才能创造出良好的视觉环境。

相关文章