中医

首页 » 常识 » 常识 » 中国汉字往事计算机时代,谁阻止了中国汉字
TUhjnbcbe - 2023/1/3 3:25:00

年.十三大召开,工作报道的字数长达三万多字。为了报道这一举世瞩目的会议,全国报社都枕戈待旦,只要前方的电讯稿送到后,就立刻排版印刷特稿。

令人意想不到的是,出版速度最快的不是《人民日报》《光明日报》等顶尖报社,而是才复刊不久的《经济日报》。依靠王选研发的华光三型激光照排系统,《经济日报》收到新华社的电讯稿后,仅20分钟就完成了整个排版工作,而其他使用铅字印刷的报社最快也要几小时才能完成制版。

从零起步到实现绝对反超,从产业断代到奋起直追,《经济日报》这短短的二十分钟背后,却是王选花费数十年书写的一段关于中国汉字的故事。

01

第二次汉字危机

「中国人用的汉字,能适应计算机时代的发展吗?」

年的当下,如果谁提出这样的问题,那么无疑会被广大网友们视为哗众取宠。而在三十多年前,这是一个不折不扣的学术性问题,很多科研专家们都为此展开了一场大讨论。

年,钱玄同在《新青年》四卷四号上发表《中国今后之文字问题》一文,他认为,「中国文字衍形不衍声,以致辨认书写极不容易,音读极难正确。这一层近二十年来很有人觉悟;所以创造新字,用罗马字拼音等等主张,层出不穷。」

谁也想象不到,在过于激进的「废除汉字论」诞生并被否定的几十年之后,汉字迎来了第二次生存危机。

上个世纪70-80年代,国企的办公室都有一个讲究,每一张办公桌上都要有一块巨大的玻璃板垫着用来写字。

「据说只有垫着玻璃板写出来的字,笔锋才硬朗、字体才挺拔。」

那时,汉字简化方案也已经推进到了第二版,虽然过度简化的字体在当年造成了一定混乱,但不得不说在简化字的加持下,我国的识字率从建国之初的不到20%上升到了66%左右。

但在这一片欣欣向荣的背景之下,暗流却早已悄然涌动。70年代的中国印刷业,依旧采用的是「铅与火」的铅字印刷,排版车间里工人需要在极其繁杂的铅字架中来回走动,把文稿所需的铅字一个个从架子上找出来,然后放到铅字盘里进行排版。这种排版方式能耗大、劳动强度高、污染严重,且出版速度极低。往往一本书想要出版,需要花费一年左右。

极低的排版速度和极高的印刷成本,意味着除了报社以外,基本没有单位能拥有即时印刷能力。

可能70后或者部分80后都会有这个记忆,当时的考试试卷都是老师用简易油印机印刷出来的,每次考试时教室里都会有一股浓重的油墨味,手掌与试卷接触的部分都会一片漆黑。

在同一时间,我们把视线投向大洋彼岸。西方的印刷技术,早已进入了“光与电”的时代。

年,美国人艾拉·华盛顿·鲁贝与德国人卡斯帕·赫尔曼,发明了第一台转轮胶印设备,将印刷速度从铅字印刷的极限每小时张提升到了每小时张。年,西方国家发明了光学照排技术,排版时整字直接模制在胶片上,利用照相方式曝光成像。年,德国发明了电子照排技术,用阴极射线管取代了原有的光学制版,世界印刷业从此进入了计算机时代。

70年代的中国,在基础工业完成从无到有之后,各项产业都在搞技术升级,出版行业也不例外。其中沈阳厂率先突破了胶印技术,并很快推广到了北京新华印刷厂。然而,万万没想到的是,印刷的效率问题解决后,整体效率的提升却卡在了制版上。

当时最先进的照排技术名叫:阴极射线管成像型照排系统。

该系统的原理现在看并不复杂:将需排的字符编码记录在穿孔纸带、磁带等存储介质上。排版时将它装入输出控制部分,经过处理输出到阴级射线管组上,并在感光材料上成像,成为制作印版用的底片。

这套现在看起来很简单的系统,遇到了大麻烦。

当时,字符的编码方式主要是黑白线段法和轮廓法。这两种编码方式有个巨大的缺点,那就是每一个字符需要占用极大的存储空间(以当时标准来说)。但对于西方国家来说,大部分的文字仅由20到30个字母组成,哪怕每个字母安排10种字体,数据也不会大到哪里去。

而汉字仅一二级字库就有近个汉字,再加上数十种常用字体、字体大小等,相关数据要是按照当时的编码的话,需要占用数G的存储空间。所以当时很多的科研人员反对数字化排版,再加上当时遇到的计算机汉字输入问题,部分学者甚至发表了一些类似于「汉字不适应计算机的发展」的极端言论。汉字拉丁化的论调,也重新被翻了出来。

第二次汉字危机,正式到来。

02

一个「骗子」

我们先来做一个假设。

如果,现在有一个病休10多年的大学助教说「我有一个办法,能很快解决7nm芯片的生产问题,并能追上国外领先的5nm的工艺制程」,你会怎么想?我想,绝大多数人都会说他是一个骗子。

70年代,王选在研制第四代激光照排技术时,也面临着这个情况。

汉字激光照排技术最早起源于“工程”。年8月,四机部联合一机部、中科院、新华社、国家出版局联名向国家计委、国务院,呈送了一份关于将汉字信息处理系统工程作为国家重点科研项目计划予以立项的报告。年9月,国家计委发文批复,同意将汉字信息处理系统工程列入国家科学技术发展计划,并命令四机部召集成立汉字信息处理系统工程(工程),后来王选研发的激光照排技术就是工程的一个子项目——汉字精密照排系统。

不过,工程启动之初,王选仍病休在家。当他从夫人陈堃銶哪里听说工程时,时间已经到了年,而且全国各地已经有5路人马在从事相关研究。作为一名年龄超过38岁的助教,王选最初只是抱着试一试的心态开始了自行研究。

通过对比当时国际流行的二代、三代的照排系统,他意识到研发汉字照排系统很难绕开汉字字模的存储难题,为此有必要直接跳过第二代光机式照排系统。而第三代阴极射线管照排系统,在使用时又经常出现电子束易散焦导致印刷模糊、排版版式少等缺点。

所以,王选提出有必要超越第二代和第三代照排系统,直接研制第四代激光照排系统。

毫无疑问,这个观点一经提出就遭到了所有人的反对,后来王选的夫人陈堃銶在接受采访时这样回忆到当时的各种嘲笑:“那会儿印刷界几乎没人相信他能做出来,各种冷嘲热讽,一个小助教,还患着病,这不是天方夜谭吗?有人说,你想搞第四代,我还搞第八代呢!”

换做是我,我也能够理解当时其他的人的看法。从0起步,直接击败别人几十年技术积累的故事,我只在起点上看到过。

无论是搞三代机还是四代机,都要解决如何存储汉字字模的难题。当时,日本NEC、京都大学等也在攻关汉字编码难题,当时他们提出了采用字元组字的算法,即把汉字当成多个字元的组合,比如“新”就可以拆分为“立”“木”“斤”三个字元。虽然这种方式能实现较大压缩,但拼出来的汉字质量较差,因此此项研究并未成功。

王选经过研究发现,汉字数量虽然繁多,但基本上都是由横撇竖捺等规则笔画组成。所以他提出了一个异想天开的方案:用矢量的方式来描述汉字,通过算法在保证放大后不失真的前提下实现数据到倍的压缩。

这个构想比西方早了近十年。

在解决核心算法后,下一步就是研制汉字激光照排系统原理性样机。当年原型机研发时,国内尚未实行改革开放,想要得到一些进口元器件和设备相当困难。举例来说,当时用于研发激光照排设备的国产计算机DJSI30内存只有64KB,而且由于70年代的中国不会造硬盘,国产磁鼓最大的容量更是只有KB。就算采用王选提出的压缩算法,信息量依然很大,最后王选团队只能采用磁鼓和磁带混合的方式解决存储和字形还原的难题。

年春,在全国各地的单位协作下,中国第一台国产激光照排系统原理样机组装完毕,并进入调试阶段。年7月27日,我国第一张使用激光照排系统的八开报纸《汉字信息处理》诞生了。

03

就算是“天选者”,历史也要跟你开开玩笑

倘若把王选研发国产激光照排系统的过程当成一篇爽文,那按理说现在也应该到了故事的结尾。接下来就是产品大卖,王选当上CEO并走上人生巅峰。

然而,就算是“天选者”,历史也要跟你开开玩笑。

年,在王选开发出第一台国产激光照排系统原理样机后,英国蒙纳公司陆续在上海、北京展出英国研发的“汉字激光照排系统”,并准备大举进入中国市场。不久以后,日本、美国公司也相继带来了他们的设备,准备同英国在中国市场一决高下。

在那个改革风起云涌、一切向效率看齐的大背景下,过分推崇国外技术的声音甚嚣尘上。国内的报社、印刷厂也几乎一边倒的主张引进国外的激光照排系统。

当时,有人劝王选说到:“你已经成功了,不需要再做下去了。”但王选认为,应用型的科技成果一定要经得起市场的考验,不能拿了国家的钱,只是做了一个实验。他果断决定:走出实验室与国际厂商一争高低。

遗憾的是,当时各家报社都不愿意拿钱投给这个看不到“钱景”的项目,许多人也在等着看王选的笑话。最困难的时候,团队里只剩下王选和吕之敏两个人。

年2月22日,时任国家进出口管理委员会副主任的领导,向国务院提交了一份报告,报告指出:北大等单位的“中文激光照排设备”的研制,已有明显成效技术接近成熟,来表示对王选工作的支持。后来又拨款20万美元让王选进口关键设备和技术后,王选团队的研发工作这才重回了正轨。

年,中国改革开放加速,英美日等国的激光照排系统开始全面进*中国市场,并很快获得了数十家出版社和印刷厂的订单。而此时王选的华光Ⅱ型照排系统虽然已经完成了从原理样机到实用样机的跨越,然而在稳定性、运营成本上并不占优势。倘若不尽快推出实用性和性价比更高的机型,那汉字激光照排系统很有可能被西方公司瓜分。经过紧张研制,年11月,华光Ⅲ型激光照排机研发成功。

华光Ⅲ型研发成功后,国家经委印刷技术装备协调小组决定选择《经济日报》进行试点。年9月30日第一套华光Ⅲ型系统运进经济日报社印刷厂。经过多次调试后,年5月22日,《经济日报》决定全报均采用激光照排系统排版。然而,系统全面上线7天后,报纸出现了大规模的重字、重行、丢字、丢行等问题。大规模的印刷错误导致报社几乎天天登报道歉,当时所有编辑联名给领导写信,要求立刻下马华光Ⅲ型激光照排系统,报社也发出最后通牒:要求10天内排除故障否则退回铅排作业。

华光Ⅲ型遇到了诞生以来的最大危机。如果《经济日报》退回铅字排版,那就意味着华光Ⅲ型系统彻底失败,中国不得不依靠购买外国设备来解决印刷行业技术升级的问题。国家经委印刷技术装备协调小组组长范慕韩深知问题的严重性,亲自请求编辑们正确看待华光Ⅲ型的试用问题,王选也在和华光Ⅲ型的生产厂家争分夺秒的解决设备遇到的问题,经过10天的奋战,《经济日报》之前遇到的问题基本解决。

接下来的故事,我只想用一个时间轴来表达。

年12月,华光Ⅲ型获得电子部的验收,正式步入商品化之路。

年初,仅售68万元的华光Ⅲ型上市,产品一经推出便有20多家报社前来订货。

年7月18日,《经济日报》卖掉全部铅字印刷设备,彻底转向电子化。

与此同时,在国内某报社在年花费万美元向美国HTS购买的照排设备,经多年调试依,依旧故障频频,无法正常使用。直到年,王选带领团队来到该报社,用北大技术对美国HTS系统进行改造,才救活了相关设备。

年底,所有国外厂商相继宣布退出中国大陆市场。

04

尾声

早在,王选在和老友聊天时,就提出「振兴中华首先就得振兴科技,振兴科技关键还得靠自己,发达国家不可能把核心技术转让给你,只能自己解放自己。」

从这个角度,再看看几十年前的王选,会发现中国印刷业的命运从选择中国创造那一刻起便注定了。如今,在中美科技战的背景下,我们又一次站到了时代的十字路口。只不过,相比于几十年的彷徨、反复,我们的答案更加坚定。

希望再过几十年,人们再度谈起现在这段历史,会说它可能是中国经济最艰难的时代,但也是中国创造最好的年代。

1
查看完整版本: 中国汉字往事计算机时代,谁阻止了中国汉字