汉字计算机编码输入的过去现在和将来(转)

作者冯玉马
从上个世纪八十年代初计算机进入我国并逐步开始普及以来,计算机汉字输入始终就是计算机中文处理的一个瓶颈,为了解决汉字计算机输入这个问题,最初采用的是大键盘汉字输入方案,然后又改为中键盘方案,最后改为标准键盘方案。现在看来,大键盘和中键盘输入方案无论从编码理论、输入效率、长时间工作疲劳程度、学习难易程度等诸多方面的哪个方面考虑,基本上没有什么可取之处,很快就被标准键盘输入方案所代替,虽然个别大键盘、中键盘生产厂商一直打着中国人用中国字键盘等等爱国口号,并一直坚持到上世纪末,但是,最后还是被无情地淘汰了。
和大键盘、中键盘输入方案相对应,八十年代初,标准键盘编码输入开始发展,最初是全拼音输入,然后又发展了压缩拼音输入,开始,这两种输入方案都是单字输入方案,由于汉字同音字多,这两种方案都存在输入效率低下的问题。此后不久,王永明先生开发出了五笔字形型码输入法、李为民先生开发出了双拼双音音码输入法和周志农先生的自然码音型码输入法,这几种输入法都具备有词组输入功能,一定程度改变了标准键盘输入法效率低下的状况,特别是王永明先生的五笔字型输入法还具有输入单字时重码低的优点,很快的在全国普及起来,周志农先生的自然码具有较好的易学性和较低的重码率也有较大的市场。
八十年代中期开始,全国掀起了轰轰烈烈的“大跃进”式的汉字编码活动,工、农、兵、学、商各行各业都有很多人在搞编码,年龄跨度从十岁左右到七八十岁,人们形象的称之为“千军万码”。当时的新闻差不多天天都有新编码问世,月月都有“重大突破”,短短几年的时间,各种形式公布的编码方案超过一千,开发出的各种输入软件一百余种。编码“三分钟学会”,“每分钟输入三百字”,“每分钟输入五百字”甚至“每分钟八百字”,“大跃进”式的口号一个比一个响,好象汉字计算机编码输入问题经过短短的几年,就被群众运动攻克了。一个部门以某种方式推广某种汉字输入法,另外一个部门以另一种方式推广另外一种输入方法,各种各样的键盘编码输入法消息满天飞。但是好景不长,没有多久,轰轰烈烈的全民编码运动就烟消云散了。绝大部分编码人及厂商最后都落得个人财两空,有的公司甚至由此而破产。“千军万码”大编码运动这一段时间,除了吹嘘口号水平一天比一天高之外,汉字编码基本上没有什么发展,绝大多数编码是极低水平的重复,有的甚至是胡言乱语,没有任何可取之处。虚假的东西一经实践检验必然露馅,当然也就免不了被淘汰的下场。
在八十年代中期到九十年代中期,计算机主要应用于文字处理,人们学习计算机,首先要学习汉字输入,并且把汉字输入放到一定重要的位置,以至使不少人一直至现在还认为,学计算机就是学打字,会计算机就是会打字,会打字就是会计算机,打字水平比较高点儿就是计算机高手。这种错误观念不但大多数普通群众认可,甚至大学的部分老师,大学管理者也是这种观点。虽然这种这种观点片面、狭隘,但是认为懂计算机必须能够较快的进行汉字输入还是对的。由于当时计算机应用的发展水平和应用水平,那段时间学习计算机的人确实大都能够以某种编码不同程度的速度进行汉字输入,而且大多数至少达到手写手写速度以上,从这点来讲,那段时间,计算机汉字编码输入普及还是取得了一定成效。
随着计算机硬件的不断升级和软件智能化水平的不断提高,计算机的功能也越来越强大,人们学习计算机的重点逐步从单纯的汉字处理发展到计算机多媒体应用和网络通讯应用,当前大部分人学习计算机甚至主要就是学习如何用鼠标实现计算机的软件功能,计算机汉字输入放到了可有可无的位置。再加上由于计算机汉字输入的方式也在不断的扩展,由最初仅有的键盘输入方式发展到了键盘输入、语音输入、手写输入和鼠标输入等多种输入方式,微软公司和哈尔滨工业大学联合开发的的全拼智能输入也取得了很大的进步,很多人认为学习计算机根本用不着学习汉字编码输入,因为他们受某种宣传的影响,认为计算机汉字输入方法已经完备了,学习计算机汉字编码输入没必要,从而放弃了学习键盘汉字编码输入。由于现在很大比例的人不会汉字编码输入,绝大多数计算机并没有配置了非键盘输入设备,在需要进行汉字处理时,绝大多数人都是用微软拼音慢慢的进行汉字输入,虽然个别计算机上配备有非键盘输入设备,但是由于非键盘输入设备大多数情况下,人们普遍还是用微软拼音输入法进行汉字输入。于是出现这种情况,不同程度上懂计算机和使用计算机的人越来越多,但能够计算机汉字快速输入的人比例越来越少,不少经常使用计算机的人一分钟输不了几个汉字,而且错别字连篇,谁看了网上聊天,谁就一定会深有感触。在信息化的今天,中国文字在信息高速公路上是这样一种状态,这种现象的出现值得我们认真反思。计算机汉字编码快速准确输入究竟需要不需要?
现在有很多经常使用计算机的人不会使用汉字编码快速准确输入汉字,有下面几个原因,首先是没有大家公认的易学性好,输入效率高的键盘编码汉字输入软件,目前的汉字编码输入软件形码记忆量大,拆字难,编码输入过程干扰思维,脑力负担较大,听打想打实现困难,学习培训时间较长等缺点。而音码编码虽然编码容易,脑力负担小,学习培训时间较短,但重码率高,输入效率低,不能适应快速输入汉字的场合。没有能够适应大家既要求输入高效、脑力负荷小、学习容易,又能适应各种环境、能适于听打、看打、想打的汉字编码输入软件,这是最重要的原因。第二是由于各种非键盘输入方法不够负责任的宣传,比如某种语音输入法曾经就宣传你能说多块,它就能输入多快,可是没有说输入里面的有大量的错别字,要知道,修改一篇错误连篇的文章比重新输入一次所用的时间并不少;某种手写输入法曾经宣传从此可以扔掉键盘,再也不用学汉字输入,可是实际上是手写输入的速度远比不上正常的手写速度,连手写的速度都达不到,还谈什么提高工作效率。厂家和商家不够负责任的宣传,使不少人产生一个错觉,汉字输入问题已经解决,不必再下功夫学汉字编码输入了。虽然在实践中很多人也深深地感觉到目前的非键盘汉字输入软件存在很多问题,远非商家所描述的那样,但总是心存幻想,希望明天早上起来一切问题就全部解决,迟迟不愿下点辛苦学习汉字键盘编码输入。
实际上,不用说非键盘汉字输入技术远远达不到完善,即使是非键盘汉字输入技术绝对完善了,非键盘汉字输入适用的范围也及其有限,更何况技术上的很多问题远远谈不上完善,有的问题是属于根本不可能绝对完善。例如语音输入中的单字输入,由于汉语自身的特点,即使再过一万年,只要汉字和音节不是一一对应关系,语音输入就永远不会实现汉字单字准确输入。手写输入完全依赖手写信息,就是软件智能处理十分完善了,由于手写的速度有限,无论何时,手写输入速度也小于手写速度,更达不到较快的速度,使用的范围更受限制。如果再考虑到非键盘输入都要求较高的硬件水平,非键盘输入都需要一定的附属硬件设备,价格远高于键盘编码输入等各方面因素的影响,真正适于非键盘输入环境,使用非键盘输入的能有几人?绝大多数人不但现在,即使在一个较长的历史时期还离不开汉字键盘输入。
对于计算机键盘编码汉字输入来讲,确实有很多地方不尽人意,无论是形码还是音码,都分别存在着不少问题。由于自身的缺点和不足,导致使用编码输入的人越来越少,但是我们也要客观分析出现这一现象的原因。近十年来,研究汉字编码输入是个萧条期,过去曾经研究过编码的人大多知难而退,撤出了这一领域。剩下来搞汉字编码输入研究和开发的基本上是国内的个人和小企业,完全属于个人行为或小集体行为,本来力量就及其单薄,再加上各自独立分散,形不成规模,要想有较大的理论创新或者是技术进步谈何容易!不用说个人行为,就是小集体行为,受人力、物力、经济等多种因素的牵制,自身生存就十分不易,想要发展哪来的力量?研究计算机汉字键盘编码输入是一个典型的高风险项目,受各方面的影响,研究成功并被广泛采用的可能性微乎其微。千余种汉字编码方案变成产品的不足百分之十,百余种已经成为产品的编码输入法只有不到百分之十有大小一点影响,真正依靠编码软件获得利润并能继续发展的只有有一定范围影响中的十之二三。为发展计算机编码输入有的公司导致破产,有的公司开发计算机汉字编码输入发展到一定阶段,但由于没有足够的经济基础半途退出,实际上能够始终坚持进行不断开发推出新版本的软件公司也就是为数不多的寥寥几家。世界上计算机不论硬件还是软件都是不到两年更新换代一次,而国内搞计算机汉字编码输入的还是仅仅凭借个人或小作坊的力量和生产方式进行开发和研制,无论国外的大计算机硬件厂商还是大计算机软件厂商每年投入的科研费用分别都是数十亿美元,而国内搞计算机汉字编码输入的全部投入不足国外厂商投入资金利息的百分之一,差距如此之大,结果必然是计算机汉字编码输入发展的速度远远落后于计算机发展的速度。
和计算机非键盘输入相比较,非键盘汉字输入的发展一开始就是建立在国内的一些公司和国外计算机界顶尖级公司的联合基础之上,无论哪一家外国公司在一个项目上财力、人力、设备、技术投资的都远远的超过了国内搞计算机编码输入力量的总和的多少倍。把国内所有搞计算机汉字编码输入的力量全部加起来远不如国外一个大公司力量的九牛一毛。几年前,非键盘汉字输入倚仗着财大气粗,广告铺天盖地无处不在,没有一家计算机销售公司不在销售非键盘汉字输入设备,而计算机键盘汉字编码输入由于财力原因,在广告大赛中却没有一点声息。在这种背景下,计算机汉字编码输入还能够坚持阵地,没有一败涂地全军覆没也实属不易,几家汉字编码软件公司依然在升级自己的输入法版本,专业录入人员基本上都还是使用汉字编码输入,文化界经常从事文字工作的大多是使用汉字编码输入。这是一个力量悬殊的较量下汉字编码输入界来之不易的胜利,但这个胜利并不是主动争取来的,而是由于对手自己软件功能存在一定问题,对手自己把自己战败的。来势汹汹的非键盘汉字输入虽然没有彻底打败键盘汉字编码输入,但是狂轰滥炸的广告宣传使不少人产生了错觉,一种既省心又省力同时又高效的汉字输入方法已经诞生,计算汉字编码输入已经过时,学习计算机汉字编码输入已经没有必要。从而放弃了汉字键盘编码输入的学习。但是,客观实际情况是新开发的几种非键盘输入方法并没有实现人们的愿望,手写输入效率非常低下,适用面窄,而且软件硬件设备代价较高,不适于普遍使用。语音输入使用范围有限,失误率较高,同时也需要必要的其他辅助设备,不适于大面积推广。所有的非键盘输入实用性并不强。最后产生的效果是,汉字计算机输入对很多人来讲非常相近于“邯郸学步”,旧的汉字键盘编码输入没有学好,新的非键盘输入又不能把汉字输入问题较好解决,遇到计算机汉字输入时怎么办?只好用微软拼音一步一步往前爬。
快速准确的汉字计算机输入究竟应该朝着那个方向发展?非键盘输入能不能解决汉字计算机快速准确输入?答案是否定的。手写输入的极限速度是手写速度,无论如何发展也不能实现快速输入;语音输入建立在语音识别和智能处理基础之上,无论技术如何完善,由于语音中不含有字型或者字意的信息,不能解决汉字单字输入。
微软键盘智能全拼整句输入或智能双拼整句输入能不能解决汉字计算机快速输入?答案也是否定的。尽管微软智能处理理论和编程实现都是非常出色的,但是在整句中经常出现很多啼笑皆非的智能判断失误,这有两方面的原因,第一是因为机器智能的作用是有限的,人的语言变化是无限的,用有限的机器智能处理无限的语言变化要达到完全正确是不可能的。第二个原因是输入信息量不足,无论目前的全拼还是双拼,都没有输入汉字的音调信息,没有语调信息就不会有完美的整句输入。即使增加了语调信息后整句输入能够比较完美解决了,汉字单字输入还是没有办法解决,仅仅依靠汉字语音信息也绝对不能解决汉字单字输入问题,要彻底解决汉字单字输入必须增加汉字单字的字型或者字意信息。巧妇难为无米之炊,没有输入必要的信息量,再好的智能处理方案和程序也不能达到理想的处理结果。
从汉语文本统计可知,大约三分之一的汉字以单字的形式出现,大约三分之二的汉字以词组的形式出现,解决快速准确计算机汉字输入实际上归结为两点,一个是汉字单字的快速准确输入,另一个是汉字词组的快速准确输入,这两个问题解决了,汉字计算机输入问题就解决了。快速准确的输入汉字单字必须通过编码来解决,只要同音同调汉字重码存在,这一原则就不会改变。汉字词组输入最好的方法仍然是编码,如果编码方法恰当,绝大部分词组、熟语、成语都可以通过编码实现无重码输入,汉字快速准确计算机输入问题就解决了。汉字计算机输入的根本出路还在汉字编码输入上。
从现在看,计算机汉字编码输入至少还在部分领域内不会被淘汰,计算机汉字输入的将来会是什么样?从理论和实际来看,任何一种输入方法都不会独霸天下,微软拼音效率低下,只适用于处理汉字没有速度要求的场合;手写输入效率低下,疲劳程度高,仅适用处理汉字不多没有速度要求的场合;语音输入错误率高,特别是输入单字多的文本,错误率甚至达到不可忍耐的程度,使用范围及其有限。要想实现高效、快速、准确汉字输入,非汉字键盘编码输入莫属。当前的问题是汉字键盘编码输入如前面所说的那样,存在一系列的不足,影响了人们对键盘编码输入的积极性,当一种编码方法简单、输入速度快、长时间使用疲劳程度低、输入过程不影响思维、能够适用于看打、听打、想打等等各种环境和场合的键盘编码输入方法产生时,键盘汉字编码输入将会进入一个新的黄金时期。
具有国家发明专利技术的计算机音节码汉字键盘编码输入方法就是具有人们愿望的理想输入法的所有优点的一种键盘汉字编码输入方法,音节码输入法将有可能使计算机汉字输入出现一个崭新的局面。
http://yjmsrf.nease.net/new_page_8.htm