张树新:我是中国互联网先烈- -| 回首页 | 2005年索引 | - -我的创业告白(转载)

五笔字型输入法基础

                                      

教学提示:在五笔字型98版软件中同时提供了86版软件,为照顾更多的用户,本书主要以86版为标准编写,在介绍过程中对86版和98版的键盘布局以及助记词进行比较。这对于初学者来说并不矛盾,因为98版软件是在86版的基础上完成的。

教学目标:本章主要介绍一些五笔字型输入法的基础知识,希望用户认真掌握好,为下一章的学习打下基础。

6.1  五笔字型概述

凡是使用过《新华字典》的人,大都对诸如“一、丨、丿、丶、亻、彳、宀、艹”这些偏旁部首不会陌生。这些偏旁部首在“五笔字型输入法”中称为字根,当然,五笔字型输入法所选用的字根和《新华字典》中的偏旁部首并不相同,但其作用是一样的。

五笔字型输入方法精心选择了125个字根,并制定了若干汉字的拆分规则。用户只要记住这些字根所对应的按键,并记住五笔字型输入方法中所制定的规则,也就学会了五笔字型输入方法。要认识五笔字型的构造思路,实际上,五笔字型就是把汉字分解的过程。五笔字型输入方法的最大特点是重码少,基本不用选字,且字词兼容、字词之间无需换档。同时,由于五笔字型输入方法对字根进行了优选,键盘布局经过精心设计,并反复实践修改,具有较强的规律性。经过指法训练,每分钟可以输入120-180个汉字。

1. 汉字的构成

汉字是由比汉字更小的“字根”构成,如:

弓长——张;木几——机;立早——章;双木——林等。

可见,一个汉字是由较小的“方块”拼合而成的。这些“小方块”就是构成汉字的最基本的单位,把这些“小方块”称做“字根”或“码元”。

五笔字型确定的字根有125种。字根又是由笔画构成的。即:

基本笔画(5)——字根(125)——汉字(成千上万种)

可见,汉字、字根、笔画是汉字结构的3个层次。

在五笔字型输入法中规定,下面的多个字根与其主字根是“一家人”,作为辅助字根:

l          字源相同的字根,如,心、忄、

l          形态相近的字根,如,艹、廾等;

l          便于联想的字根,如,耳、卩、阝等。

它们同在一个键位上,编码时使用同一个代码(即同一个字母或区位码)。字根总数以及每一个字根的笔画数是一定的,不能增加,也不能减少,它们构成了可以构成一个汉字的“基本”单位。

五笔字型输入方法精心选择了125个字根,并制定了若干汉字的拆分规则。用户只要记住这些字根所对应的按键,并记住五笔字型输入方法中所制定的规则,也就学会了五笔字型输入的方法。

2. 汉字的分解

在电脑中输入汉字一度举世称“难”。难在汉字的“多”,而电脑的输入设备键盘,只有几十个字母键,不可能把汉字都摆上去,所以要将汉字分解开来之后,再向电脑输入。

分解汉字,像把分子分解为原子那样,把汉字分解开来,比如将“桂”分解成“木、土、土”,“照”分解为“日、刀、口、灬”等。因为字根只有125种,这样,就把处理几万个汉字的问题,变成了只处理125种字根的问题。把输一个汉字的问题,变成输入几个字根的问题,这正如输入几个英文字母才能构成一个英文单词一样。

分解过程是构成汉字的一个逆过程。当然,汉字的分解是按照一定的章法进行的,这个章法总起来就是:整字分解为字根,字根分解为笔画。

6.2  汉字的字形结构

所有汉字都是由笔画构成的,但笔画的形态变化很多,如果按其长短、曲直和笔势走向来分,可以分成几十种。为了易于被人接受和掌握,必须进行科学的分类。

6.2.1  汉字的笔画

在书写汉字时,不间断地一次写成的一个线条叫做汉字的笔画。两笔写成者不叫笔画,如“十、口”等,只能叫笔画结构。一个连贯的笔画,不能断成几段来处理。如:不能把把“申”分解为“丨、田、丨”等。码元由笔画写成。汉字、码元、笔画是汉字结构的3个层次。

在这样一个定义的基础上,便可以对成千上万的汉字加以分析。只考虑笔画的运行方向,而不计其轻重长短,根据使用频率的高低,依次用12345编码,如表6.1所示。

6.1  汉字的5种笔画

 

 

笔画走向

笔画及其变体

 

1

从左到右

  ˊ

“提笔”均视为横,如,“现”是“王”字旁中的提笔,“ˊ”应属于横“一”

2

从上到下

ㄧ亅

左竖钩属于竖

3

从右上到左下

丿

 

4

从左上到右下

W

点属于捺,如,“村”字中的“木”字旁可知,点笔“W”应属于捺

5

方向转折

乙ㄋㄅ乛乚

除左竖钩除外,带折的编码均为5


6.2.2  汉字的字根

但是,一个完整的汉字,既不是一系列不同笔画的线性排列,也不是一组各种笔画的任意堆积,而是由若干笔画复合连接交叉所形成的相对不变的结构,即字根来构成的。

一般说来,字根是有形有意的,是构成汉字的基本单位。这些基本单位,经过拼形组合,就产生了为数众多的汉字。因此,字根是构成汉字最重要和最基本的单位,是汉字的灵魂。

由此可见,汉字可以划分为3个层次:笔画、字根和单字。汉字的拼形编码既不考虑读音,也不把汉字全部肢解为单一笔画,它遵从人们的习惯书写顺序,是以字根为基本单位来组字和编码,并用来输入汉字的一种方法,这乃是五笔字型方案的基本出发点之一。

由若干笔画交叉连接而形成的相对不变的结构就叫做字根。但是字根不像汉字那样,有公认的标准和一定的数量。哪些结构算字根,哪些结构不算字根,历来没有严格的界限。不同的研究者,不同的应用目的,其筛选的标准和选定的数量差异很大。

在五笔字型方案中,字根的选取标准主要基于以下两点:

l          首先选择那些组字能力强、使用频率高的偏旁部首(注:某些偏旁部首本身即是一个汉字),如:王、土、大、木、工、目、日、口、田、山、亻、讠、禾等;

l          组字能力不强,但组成的字在日常汉语文字中出现次数很多,如:“白”组成的“的” 字可以说是全部汉字中使用频率最高的。

所有被选中的偏旁部首可称作基本字根,所有落选的非基本字根都可按“单体结构拆分原则”拆分成几个基本字根。例如:平时说的“弓长张”,是说张字由“弓”、“长”组成,“弓”字是五笔字型基本字根,但“长”还需要分解成基本字根。即一切汉字都是由“基本字根”组成的了。

6.2.3  汉字的3种字型

根据构成汉字的各字根之间的相对位置关系,可以把成千上万的方块汉字分为3种类型:左右型、上下型和杂合型。同样也按照它们拥有汉字的字数多少从1~3编成代号,如表6.2所示。

6.2  3种字型

字型代号

 

 

 

 

1

左右

*   

字根之间可有间距,总体左右排列

2

上下

*    

字根之间虽可间距,总体上下排列

3

杂合

*  * 

 

字根之间虽有间距,但不分上下左右,即不分块

 表中的最后一种字又叫独体字,这3种统称合体字。两部分合并在一起的汉字又叫双合字,3部分合并在一起的,又叫三合字。合体字的分类,一般只分到三合字这一级。因为在为汉字编码时,由于这些字的字根较少,用行话说叫“信息量不足”离散不开,所以才有必要再补加一个字型信息。而对于由4个部分以上组成或者可以分作四部分的汉字,其信息量已够丰富,就不必要再考虑字型信息了。这就是我们今后要取“一二三末”4个字根,且不足四码要追加末笔交叉识别码的原因。

3种字型的划分是基于对汉字整体轮廓的认识,指的是整个汉字中有着明显界线,彼此间隔一定距离的几个部分之间相互的位置关系。

1. 左右型

左右型分为以下两种情况:

l          在双合字中,两个部分分列左右,其间有一定的距离。如:肚、胡、胆、咽、拥等。此外,虽然“咽”和“枫”的右边也由两个字根构成,且这两个字根之间是外内型关系,但整个汉字却属于左右字型。

l          三合字中,整字的3个部分从左到右并列,或者单独占据一边的一部分与另外两个部分呈左右排列,如:侧、别、谈等,都应属于左右型。

2. 上下型

上下型也可分为两种情况:

l          双合字中,两个部分分列上下,其间有一定距离,如:字、节、看等。

l          三合字中,3个部分上下排列,或者单占一层的部分与另外两部分作上下排列,如:意、想、花等。

注意:上下型汉字的上邪分和下部分之间要有一定的距离,否则不成为上下型。例如“自”字虽然也是由“丿”和“目”上下两部分组成的,但是它们是连接在一起的,没有一定的距离,因此不能算是上下型结构,应算是混合型结构。

3. 杂合型

在五笔字型输入法,将上下型的汉字代号定为3

三型(外内型汉字和单体型汉字)指组成整个汉字的各部分之间不存在明确的左右或上下型的关系,定义为杂合型。杂合型汉字主要有内外型、单体型和既不属于左右型,也不属于上下型的汉字。如:团、同、这、斗、头、飞、本、天、册、成等。

汉字的图形特征,是每一个有文化的中国人从上小学起就熟知的。这里,可以作为识别汉字的一个重要依据。比如说“口”、“八”上下排列为“只”,左右排列即为“叭”等。因此,还可以把3种字型叫做字根的3种排列方式。

在向计算机中输入汉字时,除了输入组成汉字的字根外,有时还有必要告诉电脑那些输入的字根是以什么方式排列的,即补充输入一个字型信息,目的就是在有的字取码不足四码时,要追加末笔交叉识别码的原因。

3种字型中,要追加识别时,还有5种情况,即末笔为横、竖、撇、捺、折这5种情况,那么总共就有5×3=15种情况。例如,当左右型的汉字其末笔为横时,可以追加其识别码为G,例如“柏”为左右型的汉字,按其五笔取码为SR后,只能得到“析”字,此时就必须追加识别码G,因为其最后一笔为“横”笔。又例如“章”字,应取码“立”与“早”即“U”与“J”,但需要补码“J”,因其末笔为竖,且为上下型结构。具体内容请参看7.1专门讲到的“末笔字型交叉识别码”。


6.2.4  字根的4种连接方式

一切汉字都是由基本字根组成的,或者说是拼合而成的。包括没有资格入选为基本字根的单体结构(注意并不一定都是汉字),也全部是由基本字根与基本字根或者基本字根与单笔画按照一定的关系组成的。基本字根在组成汉字时,按照它们之间的位置关系也可以分为4种类型。

1.

单是指基本字根本身就单独成为一个汉字,不与其他的字根发生联系。这样的字根称为“成字字根”如“口、木、山、田、马、寸”等。

2.

散是一个汉字由多个字根组成。各个字根之间不相连也不交,保持一定的距离。如:吕、足、困、识、汉、照等。

注意:既然字根间是可以保持一定距离的,那么它们就有一个相互位置关系的问题。要么左右,要么上下,要么杂合,总归属于一种,从而形成3种不同的字型。

3.

“连”的情况有两种:

一个基本字根连着一个单笔画。如:“丿”和“目”相连构成“自”,“丿”下连“十”成为“千”,“月”下连“一”成为“且”等。其中单笔画可连前也可连后。

注意:这种情况下的字根与单笔画之间,不能当作散的关系。

连的另一种情况是所谓“带点结构”,即一个基本字根之前或之后带一个孤立的点。例如:勺、术、太、主等字中的点,近也可,稍远也可,连也可,不连也可。

由此可以看到,一切基本字根与单笔画相连之后形成的汉字,都不能分为几个保持一定距离的部分。因此,在判断这一类汉字的字型时,它们只能是第三类字型。

4.

交是指多个基本字根相互交叉连接汉字,字根之间有重叠的部分。如:“农”是由“冖?”,“申”是由“日ㄧ”,“里”是由“日土”,“夷”是由“一弓人”交叉构成的等。

由此可以看到,一切由基本字根相交叉构成的汉字,基本字根之间更是没有距离的。因此,在判断这一类汉字的字型时,毫无疑问,它们都属于第三型。

利用字根组字时,还有一种情况是混合型,即几个字根之间有连的关系,又有交的关系。如:“丙”,是“一”一边连一个“内”,而“内”又是由“è”与“人”相交形成的,自然这类字也属于第三型。因此,基本字根单独成字,不需要判断它的字型结构;属于“散”的汉字,可以属于左右型和上下型结构(1型或2);属于“连”与“交”的汉字,一律属于杂合型结构(3);不分左右、上下的汉字,一律属于杂合型结构(3)


6.3  五笔字型键盘设计

通过前面的介绍,大家已经清楚,字根的定义以及与英文字母键是五笔字型输入法的核心,本节将介绍这方面的知识。至于具体如何根据字根来输入汉字,将在以后几节进行讲述。

6.3.1  五笔字型字根的键盘布局

125种基本字根按照字根分区划位原则,兼顾其键位设计的需要,共分成5个区,每个区又分成5个位,这样共得到:11~15GFDSA为一区;21~25HJKLM为二区;31~35TREWQ为三区;41~45YUIOP为四区;51~55NBVCX为五区,共25个键位。

1. 区号和位号的定义原则

l          区号按起笔的笔画横、竖、撇、捺、折划分,如:禾、白、月、人、金的首笔均为撇,撇的代号为3,所以它们都在3区。也可以说,以撇为首笔的字根,其区号为3

l          一般说来,字根的次笔代号尽量与其所在的位号一致,如:土、白、门的第2笔均为竖,竖的代号为2,故它们的位号都为2。但并非完全如此,如“工”字的次笔为竖(代号应为2,但它却被放在了15位,而不是12位。

l          单笔画与复笔画字根尽量与位号一致,例如,单笔画:一、│、丿、丶、乙都在第1位,两个单笔画(如二、冫)的复合字根的都在第2位,3个单笔画的复合字根(如三、川、彡)的都在第3位,依次类推。

2. 键名

每个键位上一般安排2~6种字根,字体较大的字根是键名,或称为主字根。每个键位方框左上角的字根就是键名。

3. 同位字根

每个键位上键名后较小的字根被称位同位字根。同位字根有这么几种情况,某些字根与键名形似或意义相同,如:士和士、言和讠、人和亻等。对于某些字根,其首笔既不符合区号,次笔更不符合位号,但它们与键上的某些字根“沾亲带故”,如:忄和等。

总体来讲,同位字根可分为3类:笔画、成字字根和其他字根。所谓成字字根是指该字根本身是一个字,如:甲、文、上、心等。此外,成字字根还包括一些大家日常并不作文字使用的字根,如:彳、亻、讠、氵、夂、匚、宀、冖、廴、辶、礻、衤、彡、纟等。至于在五笔字型中都有哪些成字字根,将在后面给出。图6.1以图示方式给出了五笔字型中字根的分布情况,供大家参考。

如此一来,把键名与同位字根合在一起分别对应一个英文字母键,就形成了一张五笔字型字根总表。把125种字根安排在计算机键盘上,便形成了五笔字型键盘字根总表。

五笔字型方案的键位排列,既考虑了各个键位的使用频率和键盘指法,又做到了使字根代号从键盘中央向两侧依大小顺序排列。这样做的好处是键位便于掌握,代号好学好记,操作员易于培训,击键效率便于提高。

6.1  五笔字型中字根的分布情况

4. 五笔字型键盘的特点

125种基本字根按照笔画的类别,各对应于英文字母键盘的一个区,每个区又尽量考虑字根的第二个笔画,再分作5个位,即形成55位的键盘布局。其中的位号从键盘中部起,向左右两端顺序排列,这就是分区划位的五笔字型字根键盘

五笔字型键盘充分体现了形码设计的3项要求,即:

l          相容性:使字根组合产生的重码最少,重码率在万分之二以内;

l          规律性:键位或字根的排列井然有序,使用都好学易记;

l          谐调性:又手击键时“顺手”,能充分发挥各手指的功能,使效率最高。

一个有科学依据、有实用价值因而有真正生命力的输入方案,其键盘设计应当同时满足以上3个条件。

6.3.2  键盘分区

1. 86 版的键盘布局

前面已经讲过,125种基本字根按照首笔笔画分作5类,各对应英文键盘上的一个区,每个区又分作五个位,位号从键盘中部向两端排列,共25个键位。其中Z键为万能键,它不用于定义字根,而是用于五笔字型的学习。

各键位的代码,既可以用区位号表示,也可以用英文字母表示,如:11G等价。五笔字型中键盘分区及键位排列情况如6.2所示。

6.2  五笔字型键盘分区


上面5个区中,没有给出每个键位对应的所有字根,而是只给出了键名字根,目的是给出键盘分区的示意图,详细的键盘布局如图6.3所示。

6.3  五笔字型86版键盘布局

2. 98 版的键盘布局

在五笔字型98版中,码元总共有150多个。这么多码元设计在标准键盘除Z键以外的25个键上,是很有规律的,如图6.4所示。

6.4  98版的键盘布局

6.3.3  字根助记词

上面的五笔字型键盘字根总表给出了区号和位号,由区号和位号组成的代码和键位所对应的字母,每个字母所对应的笔画、键名和基本字根,以及帮助记忆基本字根的口诀等。为了使码元的记忆可以琅琅上口,下面特为每一区的码元编写了一首“助记词”,一并列在下边(括号内的为注释内容)。读者只须反复默写吟诵,即可记住。

1. 86 版的助记词

11 王旁青头戋()五一,    (“兼”与“戋”同音)      

12 土士二干十寸雨。                                

13 大犬三()古石厂,   (“羊”指 )     

14 木丁西,

15 工戈草头右框七。        (“右框”即“匚”)    

21 目具上止卜虎皮,        (“具上”指具字的上部“且”)   

22 日早两竖与虫依。                               

23 口与川,字根稀,                               

24 田甲方框四车力。        (“方框”即“囗”)       

25 山由贝,下框几。

31 禾竹一撇双人立,           (“双人立”即“彳”

反文条头共三一。           (“条头”即“夂”)       

32 白手看头三二斤,           (“看”头即“K

33 月彡()乃用家衣底。        (“家衣底”即“豕、与?)   

34 人和八,三四里,           (“人”和“八”在34里边)    

35 金()勺缺点无尾鱼(*)    (勺缺点指“勹”)

犬旁留叉儿(I)一点夕        (指“(&)

氏无七()                  (“氏”去掉“七”为“#)   

41 言文方广在四一,

高头一捺谁人去。           (高头“Y”,“谁”去“亻” 为“讠\)

42 立辛两点六门疒,                               

43 水旁兴头小倒立。           

44 火业头,四点米,           (“业头”即“{”,四点即x}

45 之字军盖建道底,           (即“之、宀、冖、廴、辶”)摘礻()()

51 已半巳满不出己,

左框折尸心和羽。           (“左框”即“)

52 子耳了也框向上。           (“框向上”即“凵”)

53 女刀九臼山朝西。           (“山朝西”即“彐”)

54 又巴马,丢矢矣,           (“矣”去“矢”为“厶”)

55 慈母无心弓和匕,           (“母无心”即“)

幼无力。                   (“幼”去“力”为“幺”)

298 版的助记词

为了帮助学员进行记忆,五笔的作者为每个键位上的码元编写了助记词,对快速记忆码元十分有效,98版的助记词如图6.5所示。

6.5  98 版的助记词

总的来讲,读者不必靠死记硬背来熟记这些助记词。通常情况下,读者如能拆分大约500个字便大致可掌握它了。当然,要想通过理解来记住该表,其中也有一些方法。

6.3.4  98版与86版字根比较

98版在86版的基础上,对字根进行了调整,使98版的编码方案更合理,但86版则更通用。下表中,横线之上是98版与86版所在键增加的字根,横线之下是减少的字根。

6.3  98版与86版不同的字根比较

98版与86版字根助记歌比较

98版字根助记歌

 

86版字根助记歌

 

6.4  字根字的输入

汉字输入是通过手的手指击打键盘来完成的,则于每个字根在构成汉字时的使用频率不同,而十个手指在键盘上的用力及灵活性又有很大区别。为了提高输入速度,五笔字型的字根键盘分配,将各个键位的使用频度和手指的灵活性纪合起来,把字根代号从键盘中央向两侧依大小顺序排列。将使用频度高的字根集中在各区的中间位置,便于灵活性强的食指和中指操作。这样,键位更容易掌握,击键效率也会提高。

6.4.1  基本规则

五笔字型的取码规则有一首口决,内容是:

五笔字型均直观,依照笔顺把码编;

键名汉字打四下,基本字根请照搬;

一二三末取四码,顺序拆分大优先;

不足四码要注意,交叉识别补后边。

规则的具体含义为:

(1)   对于键名字,可连接按4次该键输入。

(2)   对于成字字根,可按笔画输入。


(3)   对于大量的键外字应依据以下原则:

l          按书写顺序,从左到右,从上到下,从外到内取码。

l          以基本字根为单位取码。

l          按一二三末字根,最多只取四码。

l          单体结构,取大优先;字型末笔取识别码。

6.4.2  字根的输入规则

字根字就是一些级字频度较高而形体上又有一定代表性的字根,共有25个字,各占据标准键盘上的一个键位。它们中的绝大多数本身就是一个汉字,是各个键上的第一个字根,也是“字根助记词”中打头的字根。

键名汉字输入的输入规则:

在对应的字母键上连击4次。

例如:王(GGGG)、目(HHHH)、禾(TTTT)、已(NNNN)等。

如此,把除Z键以外的25个字母键每个连击4次,即可输入相关键名字。

键名汉字共有25个,即:

       

       

       

       

       

一般成字字根的输入规则是:

先击字根所在的键位一次(称为报户口),然后再击该字根的第一、第二以及最末一个单笔按键。即打键名字根后,再打3个单笔画。如果该字根只有两个笔画,则以空格键结束。

例如:“西”第一键为“西”字根所在的字母键S,二键为首笔“横”G键,第三键为次笔“竖”H键,第四键为末笔“横”G键,所以“西”的编码是SGHG,如表6.4所示。

6.4  成字字根的输入举例

第一单笔

第二单笔

最末单笔

所击键位

广

广(Y)

(Y)

(G)

丿(T)

41  41  11  31

Y   Y  G   T

(O)

(Y)

(Y)

(Y)

44  41  41  41

O  Y   Y   Y

(T)

丿(T)

丿(T)

(H)

31  31  31  21

T   T   T   H

(K)

丿(T)

(H)

(H)

23  31  21  21

K   T   H   H

 单笔画的输入规则:

一:GGLL

|HHLL

OTTLL

WYYLL

乙:NNLL

五笔字型输入法中的单笔画,如“一”、“|”、“O”、“W”、“乙”等,第一、一二键是相同的,规定后面增加两个英文LL键。

提示:“一”是一个极为常用的字,每次打4下太麻烦了,不过还有一个“高频字”码,即打一个“G”再打一个空格便可输入。

6.5  上 机 指 导

6.5.1  字型练习

根据前面讲解的知识,练习分析下面汉字的字型结构。

例如:章  上下   

                            

                            

                            

                            

6.5.2  键名汉字的键位练习

根据字根的区位以及键名汉字的分布规律,练习写出下面键名汉字所在的区位号以及位于键盘上的哪一个键位。

例如:王  11  G 

                                

                                

                                

                                

                                

                                 

6.5.3  字根练习

根据字根的分布,下面练习鉴别字根与非字根,如果是字根,写出它所在的键位;如果是非字根,将其拆分成基本字根。

例如:王  G     廿    

   ,      /      >     

    B                       ó   ò   ê   ì   í   é  ú   ü   

【作者: sancky】【访问统计:】【2005年08月23日 星期二 18:37】【 加入博采】【打印

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=2678672

回复

评论内容: