::: {#aff0 .section .section .section—body .section—first} ::: section-divider
:::
::: section-content ::: {.section-inner .sectionLayout—insetColumn}
被遗忘的中文键盘历史 {#2752 .graf .graf—h3 .graf—leading .graf—title name=“2752”}
今天,中文打字是通过一个称为输入法编辑器的软件界面,将QWERTY键盘击键转换成中文字符。但情况并非总是如此。托马斯·S·穆拉尼(Thomas S. Mullaney)的新书《中文计算机:信息时代的全球史》(The Chinese Computer: A Global History of the Information Age),由麻省理工学院出版社出版,揭示了20世纪中文输入的被遗忘的历史。在这篇文章中,它改编自书中的摘录,他详细描述了20世纪60年代和70年代摒弃QWERTY的多样化中文输入系统。
“这将永远摧毁中国,“一位年轻的台湾学员在全神贯注地坐着时想到。著名历史学家阿诺德·J·汤因比(Arnold J. Toynbee)正在舞台上,他在华盛顿与李大学(Washington and Lee University)上发表题为”历史视角下的世界变化”(A Changing World in Light of History)的演讲。这次演讲深入探讨了教授最喜欢的研究领域:人类文明的起源、成长、死亡和解体,这些都在他的杰作《历史研究》(A Study of History)中得到了不朽的记录。今晚的演讲聚焦于中国。
中国是汤因比的例外:和埃及一样古老,它是一个经受住了时间摧残的文明。他认为,中国连续性的秘诀是基于性格的汉字书写。基于性格的书写作为一种统一的媒介,为防止离心力撕裂这个伟大而多样化的文明提供了防护措施。这种千年的完整性现在受到了威胁。的确,当汤因比讲话时,北京政府正在忙碌地部署汉语拼音,这是一种基于拉丁字母的罗马化系统。
听汤因比演讲的台湾学员是叶长辉(Chan-hui Yeh),他是附近弗吉尼亚军事学院(VMI)的电气工程专业的学生。那个晚上与阿诺德·汤因比的相遇永远改变了他的人生轨迹。这也改变了中文计算的轨迹,引发了一连串的事件,最终导致了历史上可以说是第一个成功的中文IT公司的成立:由叶长辉在汤因比离开舞台14年后创立的Ideographix。
在20世纪60年代末和70年代初,中文计算经历了多次巨变。中文计算的挑战不再局限于小规模实验室和独立发明家,而是由亚洲、美国和欧洲的工程师、语言学家和企业家接手。
中文计算机的设计也发生了巨大的变化。在这个时代出现的众多竞争设计中,没有一个采用了QWERTY风格的键盘。相反,其中最成功和最被称赞的系统之一 --- --- 由叶长辉设计的IPX,具有120维的”Shift”接口,将近2万个汉字和其他符号打包进一个仅比QWERTY接口略大的空间。其他系统则配备了从256到2000个键的键盘。还有一些系统完全放弃了键盘,采用了触控笔和触摸敏感的平板,或者是一个围绕旋转圆柱界面的汉字网格。就好像除了QWERTY风格的键盘之外,每一种可以想象的接口都在被探索。 ::: ::: :::
::: {#70cc .section .section .section—body} ::: section-divider
:::
::: section-content ::: {.section-inner .sectionLayout—insetColumn}
叶长辉的120维超移中文键盘 {#af18 .graf .graf—h4 .graf—leading name=“af18”}
叶长辉于1960年毕业于弗吉尼亚军事学院,获得电气工程学士学位。他继续在康奈尔大学深造,于1963年获得核工程硕士学位,1965年获得电气工程博士学位。叶长辉随后加入了IBM,不是去开发中文文本技术,而是利用他在自动控制方面的背景,帮助开发大型制造厂的计算模拟,如造纸厂、石化炼厂、钢铁厂和糖厂。他被派驻在IBM在加利福尼亚州圣何塞相对新的办事处。
然而,汤因比的讲座一直萦绕在叶长辉的心头。在IBM工作期间,他利用业余时间探索汉字的电子处理。他坚信中文的数字化是可能的,中文书写可以带入计算时代。他认为这样做将保护汉字免受政府的影响,他们似乎将汉字的现代化等同于汉字的罗马化。这种信念非常强烈,以至于叶长辉最终辞去了在IBM的高薪工作,试图通过计算的力量来拯救中文。
叶长辉从中文词汇中最复杂的部分开始,然后从那里回溯。他特别关注一个字符:鹰(“eagle”),这是一个复杂的图形,需要24笔画来组成。他推测,如果他能为这样一个复杂的字符确定一个合适的数据结构,他将大有进展。通过仔细分析,他确定一个包含24个垂直点和20个水平点的位图可以做到这一点,占用60字节的内存,不包括元数据。到1968年,叶先生感到足够自信,迈出了下一个大步 --- --- 申请他的项目专利,绰号为”铁鹰”(Iron Eagle)。铁鹰项目迅速引起了台湾军方的兴趣。四年后,在台湾方面资金的承诺下,叶长辉在加利福尼亚州森尼维尔成立了Ideographix。
Idegoraphix的旗舰产品是IPX,它是一个基于多个子系统的复杂协调构建的中文排版和传输系统。
IPX系统的奇迹是键盘子系统,它使操作员能够输入高达19,200个中文字符,尽管其尺寸适中:宽59厘米,深37厘米,高11厘米。为了实现这一非凡的成就,叶长辉和他的同事们决定将键盘不仅仅视为一个电子外围设备,而是作为一个完整的计算机:一个由微处理器控制的”智能终端”,与常规的QWERTY风格设备完全不同。
坐在IPX界面前,操作员可以看到以16乘10的网格排列的160个键。每个键上不是单个中文字符,而是15个字符组成的微型3乘5阵列。这160个键,每个键上有15个字符,总共产生了2,400个中文字符。
汉字并没有像QWERTY设备上的字母和数字那样印在键盘上。这160个键本身是空白的。相反,2400个汉字印在覆膜纸上,装订成螺旋装订的小册子,操作员将其平铺在IPX接口上。IPX键不是按钮,而是压力感应垫。操作员会按下螺旋装订的小册子,以压下直接下面的键垫。
要访问2401至19200号字符,操作员只需翻到包含所需字符的页面。小册子包含多达八页 --- --- 每页包含2400个字符 --- --- 因此潜在符号的总数接近20000。
在其存在的头七年里,IPX的使用仅限于台湾地区军队。随着岁月的流逝,这种独占性放宽了,叶长辉开始在私营和公共部门寻找客户。叶长辉的第一个主要非军事客户包括台湾地区电信管理局和台北国税局。对于前者,IPX帮助处理和传输了数百万张电话账单。对于后者,它使得税务申报文件的生产速度和规模前所未有。但IPX并不是市场上唯一的选择。 ::: ::: :::
::: {#38ce .section .section .section—body} ::: section-divider
:::
::: section-content ::: {.section-inner .sectionLayout—insetColumn}
中国大陆的”中型”键盘 {#23f6 .graf .graf—h4 .graf—leading name=“23f6”}
到20世纪70年代中期,中国大陆在大型机计算领域的先进程度远超大多数外界人士的想象。1972年7月,就在美国总统理查德·尼克松著名访华几个月后,由著名美国计算机科学家组成的一个真正的蓝带委员会访问了中国。当时,这个代表团参观了中国主要的计算机科学中心,得知在多年中美隔绝期间,中国同行在该领域取得的进展时,代表团成员都感到震惊。
然而,有一个关键的计算领域代表团并未目睹,那就是汉字的计算处理。直到1974年10月,中国大陆的工程师们才开始认真研究这个问题。此后不久,1975年,北京大学新成立的汉字信息处理技术研究室(Chinese Character Information Processing Technology Research Office)着手创建”汉字信息处理与输入系统”和”汉字键盘”。
该小组评估了十多个汉字键盘设计方案,这些设计分为三大类:大键盘方案(large-keyboard approach),每个常用汉字对应一个键;小键盘方案,如QWERTY键盘;以及中型键盘方案,试图在上述两者之间找到一条中间道路。
该团队对QWERTY风格的小键盘提出了两大主要批评。首先,按键太少,这意味着许多汉字被分配到了相同的输入序列。此外,QWERTY键盘在充分利用按键方面表现不佳。大多数情况下,QWERTY键盘上的每个键仅分配两个符号,其中一个需要操作员按住Shift键才能访问。团队认为更好的方法是”一键多用”的技术 --- --- 为每个键分配更多符号,以充分利用界面空间。
团队还研究了大键盘的方法,其中2000个或更多常用汉字被分配到桌面大小的界面上。中国各地的几个团队都在研发这些大键盘的不同版本。然而,北京团队认为大键盘方法过于繁琐和不实用。他们的目标是充分利用每个按键的潜力,同时保持按键数量的最小化。
经过多年的努力,北京团队最终设计出一款拥有256个按键的键盘,其中29个用于各种功能,例如回车和空格,其余227个用于输入文本。每次按键生成一个8位代码,存储在穿孔纸带上(因此选择了256,即2的8次方,个按键)。这些8位代码随后被转换为14位内部代码,计算机使用这些代码来检索所需的字符。
在将多个字符分配到单个按键的设计中,该团队的设计让人联想到Ideographix的IPX机器。但这里有一个变化。团队不仅将完整的独立汉字分配给每个按键,还分配了一些汉字部件。具体来说,每个键最多可关联四个符号,分为三种类型:
- [完整汉字(每个键不超过两个)]{#5b6c}
- [汉字部件(每个键不超过三个)]{#efa3}
- [大写符号,用于切换到其他语言(每个键限一个)]{#3643}
总的来说,这款键盘包含423个完整汉字和264个汉字部件。在安排这264个汉字部件时,团队想出了一种优雅而巧妙的方法来帮助操作员记住每个部件的位置:他们将键盘视为一个汉字。团队将这264个汉字部件放置在键盘上对应它们在汉字中通常出现的区域。
在最终设计中,北京大学的键盘能够输入总共7,282个汉字,团队估计这将涵盖日常使用中超过90%的汉字。在这个字符集中,423个最常用汉字可以通过一次按键生成;2,930个汉字可以通过两次按键生成;再有3,106个汉字可以通过三次按键生成。剩下的823个汉字需要四到五次按键才能生成。
北京大学的键盘只是那个时代众多中型设计之一。IBM为中文和日文创建了自己的256键键盘。在1970年代,这款键盘类似于IPX系统的设计,包含一个12位数字键盘,操作员可以用它来”切换”每个键上的12个完整汉字(总共3,072个汉字)。1980年,香港中文大学教授罗秀昌(Loh Shiu-chang)开发了他称为”乐氏键盘”(Loh’s keyboard)的一款键盘,也具有256个按键。
但也许那个时代最奇特的中文键盘是由英国设计的。 ::: ::: :::
::: {#505d .section .section .section—body} ::: section-divider
:::
::: section-content ::: {.section-inner .sectionLayout—insetColumn}
圆柱形中文键盘 {#f835 .graf .graf—h4 .graf—leading name=“f835”}
1976年冬天的某一天,在英国剑桥,一个小男孩正在寻找他心爱的Meccano套装。Meccano是美国Erector套装的前身,这款流行的英国玩具为未来的工程师们提供了无限的模块化可能性。安德鲁(Andrew)最近还在玩这些齿轮、轴和金属板,但今天它们却不见了。
走进厨房,他抓到了偷窃者 --- --- 他的父亲,剑桥大学研究员罗伯特·斯洛斯(Robert Sloss)。连续三天三夜,斯洛斯占用了儿子的玩具,专注于制造一个奇特的圆柱形旋转装置。这引起了小男孩的注意,也吸引了《电讯先驱报》的记者前来亲眼目睹。最终,它吸引了英国电信巨头Cable & Wireless的关注和资金支持。
罗伯特·斯洛斯正在制造一台中文计算机。
斯洛斯于1927年出生在苏格兰。他加入了英国海军,并接受了一系列智力测试,显示出他对外语的天赋。1946年和1947年,他被派驻香港。斯洛斯后来加入公务员队伍,成为一名教师,后来在英国空军担任非委任军官。由于他的教学经验、语言天赋和亚洲背景,他被邀请在剑桥教授中文,并于1972年被任命为讲师。
在剑桥,斯洛斯遇到了彼得·南卡罗(Peter Nancarrow)。南卡罗比斯洛斯小十二岁,接受过物理学培训,但后来成为了一名专利代理人。这位38岁的有胡子的南卡罗自学了挪威语和俄语作为”爱好”,然后与斯洛斯联手,致力于建造一台自动中英文翻译机。
他们很快发现,翻译机设计的瓶颈在于字符输入 --- --- 即如何将手写的汉字、定义和语法数据输入计算机。
在接下来的两年里,斯洛斯和南卡罗全力投入设计中文计算机接口。正是在这个过程中,斯洛斯”偷走”并改造了儿子的Meccano套装。斯洛斯的改造很快取得了成果:一个被称为”编码中文字符的二进制信号发生器”(Binary Signal Generator for Encoding Chinese Characters into Machine-compatible form)的工作原型,也称为Ideo-Matic Encoder和Ideo-Matic 66(以机器的66×66字符网格命名)。
机器网格中的每个单元都分配了一个与X列和Y行值相对应的二进制代码。在总空间方面,每个单元格为7平方毫米,其中4,356个单元格中的3,500个用于汉字,其余的分配给日文字母或留空。
斯洛斯和南卡罗接口的显著特点不是网格本身,而是他们决定将网格围绕一个旋转的管状结构排列,而不是将4,356个单元格排列在一个矩形界面上。打字员用一只手旋转圆柱形网格,用另一只手左右移动光标以指示4,356个单元格中的一个。按下按钮会产生与所选汉字或其他符号对应的二进制信号。
Ideo-Matic Encoder在20世纪70年代末完成并交付给Cable & Wireless。这台机器重7公斤,宽68厘米,深57厘米,高23厘米,受到了行业和媒体的关注。Cable & Wireless购买了这台机器的使用权,希望能够大规模生产,面向东亚市场销售。 ::: ::: :::
::: {#2538 .section .section .section—body .section—last} ::: section-divider
:::
::: section-content ::: {.section-inner .sectionLayout—insetColumn}
QWERTY的回归 {#ac36 .graf .graf—h4 .graf—leading name=“ac36”}
IPX、Ideo-Matic 66、北京大学的中型键盘,甚至所有其他定制设备,都很快走向了相同的命运 --- --- 被遗忘。时代在变。定制设计的中文文本处理系统时代即将结束,一个新的时代正在形成。这个新时代有很多名字:软件革命、个人计算革命,以及不那么美好的名字 --- --- 硬件的消亡。
从20世纪70年代后期开始,定制的中文接口逐渐从市场和实验室中消失,被一波又一波的西方个人计算机所取代,这些计算机涌入中国。随着这些计算机的到来,QWERTY键盘在中文输入中的复兴也随之而来,与今天汉语电脑用户所使用的系统类似 --- --- 通过一个软件层将拉丁字母转化为汉字。这种通过输入法编辑器(IME)来输入的转变,并没有像历史学家阿诺德·汤因比所预言的那样导致中华文明的衰落。然而,它确实从根本上改变了中文使用者与数字世界及自身语言的互动方式。
Chinese Keyboards: A Forgotten History{.markup—anchor .markup—p-anchor data-href=“https://spectrum.ieee.org/chinese-keyboard?ref=thebrowser.com” rel=“noopener” target=“_blank”} ::: ::: :::