副标题:我们文字的不确定性及我们拼写的随意性

这章字面上讲的是具体的字典,但实际也是在讲抽象的词汇,故本章和上一章在逻辑上的关联是比较强的。从口语到书面语,文字量出现了可观的增长,故而为其做出划分是有必要的。词典将文字做了尽可能完备的记录,以便能确定语言的“标准”。

词典为文字的持久性提供了正式认定,它表明一个字词的意义来自于其他的字词。这意味着所有的字词聚集到了一起而形成了一种互相关联的结构(图),它们相互定义。

然而,文字也是时刻在发生着改变,如何从这不确定性中确定权威,这是词典编纂者的一大难处。

字典诞生的条件

印刷业、商业、交通、语言等等方面的快速发展,呼唤着语言的“标准化”。这种需求是词典诞生的原因。

引例

考德里的《字母排表》是信息史上的一座里程碑,但遗憾的是人们对于作者几乎一无所知,甚至连名字都拼不对。关于拼写这件事,书中提到:

随着印刷书的出现和普及,人们逐渐产生了这样一种感觉,即单词的书写形式理应是确定的。

英语

(英语)字典诞生的另一个原因和英语本身的特点相关。

英语是当时的世界上已是多变,多态而多源的。日耳曼民族、基督教传教士、法国对英语的影响接踵而至。很明显的例子就是日耳曼语中的cow,pig,ox与法语中的beef,pork,mutton。中世纪以来英语特点更是如此,对此也有知识分子持不满态度。

而随着知识分子开始有意识地从拉丁语和希腊语中借用单词来表达英语中原先没有的概念,外来词的数量越来越多。考德里对这种做法感到不悦,他抱怨道:“有些人对于外国化的英语趋之若鹜,却把他们母亲的语言丢到九霄云外。”

人物

谈及考德里,一下是他的个人简介。

同情清教的牧师,宣扬平等思想,受教会的排挤。他长期致力于搜集单词,曾出版过指南性著作,在1604年出版了他的简明词汇表。

致力于维护英语的简洁性到了顽固的地步,重视对常见词的运用,以便受教者能听懂,同时反对英语的外国化。

字典使用的排序

字典序

关于字典序,这种古老而现代的排序方式,书中有这样的论述:

但即便在当时,这种机制在人们看来是不自然的,因为它迫使读者将信息从单词的意义中剥离出来,将单词严格地是为字符串,集中精力于单词的字母组合上。

但当人们接受这种排序方式之后,情况便不一样了。

这样做的效率惊人,因为这种机制可以很容易地扩展到任意规模,并且宏观结构和微观结构一模一样。一个人只要掌握了字母表顺序,就可以丝毫不差地在包含了无论是一千个还是一百万个单词的列表中定位到任意条目,而且在查找过程中无需了解有关单词的意义。

书中还有个巧妙的类比。

从按字母表顺序排列的角度看,单词无非就是一枚枚硬币,可以将其分别投入不同的投币口。

事实上,首份按照字母表编排的目录直至1613年才被制作出来。(但我对印刷的历史并无概念所以不知道这意味着什么)

“本质序”

性质接近字典的《尔雅》按照意义将其条目归为不同的主题,埃及人与阿拉伯人则将单词按哲学或教育原则加以组织,对此,作者有言:

这些列表组织的其实不是单词本身,而是整个世界,也就是单词所代表的事物。

莱布尼茨明确区分了这两种排列方式:前者从词到物,而后者从物到词。

字典面临的难题:意义

字典释义

为语言解释意义并不总是件容易的事情,因为这件事本身也要借助语言。

双语词典的目的比单语词典的更为明确,毕竟将拉丁语转化成英语有其价值,而将英语翻译成英语似乎就难以理解了。然而在这里,释义是关键所在。

我们可以明显看出,他(考德里)在着手编写释义时时心怀警惕的,对于这些释义的可靠性他也并不十分确信。意义甚至比拼写更善变。

简单的释义如同义或是从属关系(a kind of),但有的词的意思很复杂,如vapor,需要运用“三角定义法”。

但仅仅用一个词解释另一个词,不论是同一关系还是种属关系,对于词典编纂者来说,还远远不够。一种词语中单词之间的关系错综复杂(chaos),这种线性的解释方法根本无法完全应付。

还有其他的难点:抽象单词。

而对于其他表示概念和抽象的单词,因其与感性认识距离更远,考德里需要另寻别的解释方法。他逐渐摸索出了一种方法,即以平实而尽量精炼的语言描述给他的读者。我们可以从中看到他的为难之处,一方面他既要理解某些单词,另一方面还要将他的理解表达出来。

最为棘手的可能是科学中的技术名词。(即便在今日,对它们的解释仍是相当困难的,因为涉及的是不同的语言体系)

其他的问题也很多,不仅限于单词本身。

不仅是单词,知识也在不断变化,而语言也在时刻进行自我反思。因此,即便在考德里从库特和托马斯哪里照抄东西的时候,从根本上说,他还是在孤军奋战,并没有任何权威可供他咨询。

词典与逻辑也存在着密切的关系:

这时字词必须被当作字词来看待,不同于所代表的事物,代表的只能是其他字词。在20世纪,随着逻辑学的深入发展,这种循环定义的潜在可能性就可谓了一个问题。维特根斯坦就抱怨道……这呼应了三个世纪前牛顿的不满,只是现在的问题更为复杂。

其他释义

除去编纂字典需要确认意义,推动科学的发展同样需要将单词与意义连接起来。

在当时,科学作为一种探寻自然界及其规律的社会制度还尚未出现,但这时的自然哲学家们已经开始产生对于字句的本质及其意义的特殊兴趣。他们需要比已有字词更贴切的用语。

伽利略发现太阳黑子后首先意识到这里存在一个语言问题(人们一直以来称太阳为“最纯净最清澈之物”),名实不符对思想的冲击。(今天的很多历史遗留也都是错误的,如“阿拉伯数字”这个名头)

牛顿在开始建筑力学大厦的时候则是使用了障眼法:不去定义时间、空间这些“众所周知”的概念,然而定义它们是他的目的所在。选择“质量”这个词也费了一番功夫,正如书中所说:

可见,没有一个恰当的用语,他就寸步难行。

字典编纂与其中的难题

早先的字典

从1613年的考德里,到1616年的布洛卡(他出版了《英语释讲》,较《字母排表》词汇更多),到1656年的布朗特,编写者的认识在不断深化。

他(布朗特)好像已经意识到,自己瞄准的是个活动靶。他在前言中写道,词典编纂者的“工作没有尽头,因为我们的英语具有每天都在变的特性”。布朗特给出的释义比起考德里的要详尽得多,并且他还试图提供词源信息。

虽然开拓者的工作可能有些稚嫩,但这却是有重大意义的。

在最伟大的词典《牛津英语词典》(OED)出版之际,第一版的编辑们却向他那本“薄薄的小册子”致以了敬意。他们称之为“最初的橡籽”,OED这课参天橡树正是从这粒种子成长而来的。

网络时代的OED

谈到Pluto被除名行星一事对字典的影响,书中的这句话可以和第十四章关于wiki中namespace的论述相映成趣。

从命名的角度看,天上已经快拥挤不堪了。

回到正题。随着网络的发展,传统的字典不能不受到影响。

在他(辛普森,牛津字典编纂组成员)的书桌上,除了单词卡片以外,还有着一根连入英语神经系统的导线。通过这根导线,它可以即时连接上由遍布全球的业余词典编纂者的网络……当词典遇上了互联网,两者都将面貌一新。无论辛普森多么热爱OED的渊源和遗产,也不论他愿意与否,他都正在引领一场革命,改变着OED——它是什么,知道什么,视野如何。考德里是孤军奋战,辛普森则是处于网络之中。

OED的目的,一在竭力捕捉语言的流变,二在担负起固化语言的任务。这是非常困难的任务,从丰富多样的拼写,到来源单一的“罕用”词。这期间编辑们反复强调自己只是选择了“当代最常用的拼法”,但仍避免不了武断的决定。

书中还提到了OED在收录新词等方面的一些历程,这些是趣味性的历史事实,和我们今日的生活也有着千丝万缕的联系,中心思想是关于编辑们对完备性与多样性的追求还有对随意性的否定。

搜集单词的困难

从无意识到有意识,初期的词典编纂者充满了雄心壮志。

在考德里,词典是一种历史快照,他的视野无法超出他当时所在的历史阶段。塞缪尔·约翰逊则更为自觉地意识到词典的历史维度,并以此作为理由之一为自己雄心勃勃的计划进行辩护。

Samuel Johnson认为语言曾经是“不受约束”的,故他要把它从无穷无尽的流变中解放出来。

“它(语言)在每一种文学体裁的成长过程中都不可或缺,但它自身却一直以来遭到忽视。它苦于传播过程中的放任自流,以致变得极其纷繁复杂,对于时间和时尚的暴虐也只能逆来顺受,而且还要忍受无知的腐蚀和创新的心血来潮。”

但是,这是非常困难的过程。

直到OED,词典编纂者们才开始试图揭示语言的历史全貌,因而OED成为了一幅历史全景图。进入电子时代后,这项事业的意义愈加彰显无疑。

编纂者开始工作的第一步是寻找单词,并追溯其历史演化。最初的编辑们认为声望卓越而品质出众的书籍是词汇不言而喻的来源,他们征集读者将曾经的作品阅读完毕以将单词一网打尽。他们认为这片领域虽然辽阔,但还是有疆界的,故而有着一一梳理的勇气。

但到了现在,它似乎不再是有限的了。词典编纂者们开始接受语言是无界的事实。他们熟知默里的一句名言:“英语之圆有清晰明确的中心,但没有可以辨识的圆周。”在中心的是那些无人不知的单词。而在边缘,默里认为是俚语、黑话、科学术语以及外来词,对此每个人的认识都各不相同,并且没有一个人的认知可以被认作“标准”。

遗憾的是,默里认为“清晰明确的”中心地带实则也存在着无限性和模糊性。认识到这一点的Samuel Johnson采取的是投降的策略。

但人类的语言世界总会有与世隔绝的地方。一个山谷里讲的语言与相邻山谷里的多少有所差别。而现在尽管山谷之间已经不像以前那样封闭,但山谷的数目却比以往要多。

如果词典编纂者用以监听语言的耳朵的灵敏度真的有一个极限,那么现在人们也没有找到这个极限所在。

网络时代的词汇

词汇的增长常常是爆炸式的,科技等领域的发展就是一个明显的原因。词汇的发展源于需求的增长,而一些需求是细胞分裂式的,而另一些则比较微妙。Mondegreen(与网络用于“空耳”有相似)一词就有其历史的缘由:这是一份相当古老的经验,但直至歌曲普及开来以前都不会进入词典(是的,这也是meme)。其他的共同经验,大抵也是如此。(故而语言的未来,在我看来,是非常难以预判的)

词汇增长的复杂度并非是多项式程度的,也没有很好的计量方式。即便是编纂者不断提高新词入选的门槛,这仍然是一项复杂得可怕的工作。

词汇是对共同经验的一种量度,而后者始于互连通性。在四个世纪里,说英语的人从五百万激增至十亿,但更重要的动力来自这些使用者之间以及当中存在的连接数量。数学家会说,信息不是以几何方式增长,而是以组和方式增长,后者的增长速度远快于前者。

关于词汇,让我们以对它的分析结束这一章吧。

全体单词的集合,也就是词汇,构成了语言的一个符号集。一方面,这是个基础性的符号集,因为按此对于任何一门语言来说,都是可识别的最小的意义单元,而且得到了该语言使用者的普遍认同。但另一方面,它又远不是基础性的,因为随着传播技术的发展,语言中的讯息可以采用比其小得多的符号集加以分解、编码和传输,比如字母、点和划、鼓声的高和低等。这些符号集是离散的,而词汇不是,它更加无序,而且在不断膨胀。事实上,词典编纂被证明是一门不适合精确计量的科学。据说英语这门最庞大、最普遍使用的语言,粗略估计拥有将近一百万个意义单元,但语言学家自己没有什么专门的标尺,将他们试图量化新单词出现的速率时,他们也倾向于向词典寻求帮助。然而,即使是最好的词典也试图逃避这样的责任,毕竟词与非词之间的边界总是模糊的,从中无法划出一条清晰的界线。

小结

章节中的一些部分可以和前面的章节或是后面的章节结合起来阅读,此处仅就“两本字典”作结。

考德里的字典

①主要是自发的,受社会条件支配

②在“确认意义”这方面做出了一些尝试

③采用字典序这一有力的排序方式

约翰逊字典与OED

①主要是自觉的,认识到了规范语言的必要性

②认识到了规范与记录语言的困难之大,采取了不同的对策,达到了不同的效果

其他论述

①网络时代词汇量的增长与社会条件相关,以组和方式增长

②语言并非一个足够离散足够基础的符号集,故编纂词典并不是门可精确计量的科学

③语言并非“有序”的,其中心同边界一样不确定而会膨胀

④科学的发展首先需要解决语言的问题(林奈的工作也可以看作这点的例证)