疑难汉字速查手册 --- V5.3
                                                        ----- 黑龙江大学数学科学学院 傅兴尚 郝立柱 迟新江

    系统提供了相当广泛的组合查询条件,本系统的核心功能是按汉字的分解信息查询。该功能充分考虑了汉字的结构组成以及拼写
原则,同时又提供了依据汉字的汉语拼音、五笔型、笔画以及笔顺进行的组合查询,这极大地加快了汉字查找的速度。在实际工作中,
遇到疑难汉字是很普遍也是很苦恼的事情,自造字总是不那么美观,然而一时又很难在字库中找到所需的汉字,而在生活中是经常要
遇到疑难汉字的,比如在人的姓名中用到的疑难汉字就较多,大量的疑难字字库中都已经存在,只是很难找到而已,本系统就为此而
设计,帮您快速找到所需的汉字。
    当查询到汉字后,您只需要在该“汉字”上点击一下鼠标左键就可以将汉字发往剪贴板,在您的编辑环境下,点击鼠标右键选择
粘贴(或按快捷键Ctrl+V)即可将汉字录入到您的系统中。
    本系统提供的不是输入法,所以不适合大量录入汉字,但是非常适合查询疑难汉字,也就是用您当前的输入法很难找到的汉字可
以在此查询。
    以下分三个方面对于本系统做以简单的介绍。

    一、约束条件
    就是对查询结果进行的条件限制。系统共有八种限制:

    1.汉字分解表:这个功能是本系统进行查询的主要功能。
    由于大多数的汉字可由其它汉字组合而成,比如“功”:可由“工”和“力”两个汉字组成。基于此特点,用户查询时可在“汉
字分解”处输入“工力”,系统即可查出一切包含工和力的汉字。
    对于重复组字的汉字如:“吕”系统将汉字中的重复信息采用“口口”标识。
    又如“诩”,系统用“讠羽”或“讠习习”标识。
    另外系统不考虑用户对汉字拆分的前后顺序,即功字可拆分为“工力”也可以拆分为“力工”。
    对于公用笔画汉字如 “卡”,用户可拆分为“上卜”或拆分为“上下”。
    偏旁、部首、独体字和难字的查询可单独查询,对于偏旁部首及独体字要求用户按笔顺与笔画共同限制查询,以加快查询速度。

    2.笔顺:本系统将汉字的书写顺序按“横竖撇捺折”编号依次是“12345”,系统按从前向后依次匹配用户输入的笔顺进行过滤
查询。考虑到大多数人的汉字书写习惯,部分汉字的笔顺与“辞海”中汉字的笔顺不相符,多数汉字与“金山词霸”中的笔顺相符,
但也有极个别的汉字既不与“辞海”的顺序相符也不与“金山词霸”中的顺序相符。之所以这样做的原因是,很多人的汉字书写都是
不规范的,为了能尽快地查询到所需汉字,特设于此。(“金山词霸”中有许多汉字的笔顺与“辞海”不符)。考虑到每个人的下笔
顺序都有差别,所以本系统建议使用汉字的前九笔的笔顺进行查询,用以降低出错概率。

    3.按笔画查询:系统允许用户对查询结果中的汉字的笔画进行限制。比如查出15画到16画的所有汉字,输入 15-16 即可。若只
想查询10画的汉字,输入 10 即可。即当输入的是笔画范围时需要用“-”将两个数隔开。

    4.拼音编码:拼音编码是普通的无声调的汉语拼音和其尾部用1234来表示声调的数字共同组成的一种编码。对于用户输入的无声
调拼音编码采用“模糊”查询的方案。“模糊”查询是查询出用户输入的拼音编码与系统中所有拼音编码前若干位相同的汉字。查询
过程中提供了对多音汉字的查询。系统允许使用拼音的声调,系统规定阴平、阳平、上声和去声的音调分别为1、2、3、4,即一声、
二声、三声、四声分别为1、2、3、4。带有表示音调的数字的查询实际上是精确查询。
    注意:系统仅仅对GBK给予编码的汉字给出了拼音编码,而对于扩展字符集则没有给出其拼音编码。即对于很多的Unicode编码没
有给出其拼音的编码。
    例如:输入“cha”,则将拼音编码为“cha,chai,chan,chang”等等的汉字都查询出来,显示在查询结果集中。而查询“cha2”
则系统将仅给出“cha2”的汉字,不会给出“chai2”等等的汉字。

    5.五笔编码:本系统按“五笔字型”显示五笔编码信息。系统在用户输入五笔编码信息后按“模糊”方案进行查询。编码信息中
提供了多种可能的“五笔字型”编码方案。若需要精确查询“五笔字型”编码信息,可以在输入的信息后面额外附带一个空格即可。

    6.单字查询:主要用于已知汉字想查询其五笔字型、拼音或笔画数等。
    由于单字的查询条件已经限制到最末级,故使用时系统自动将其它限制条件全部屏蔽。

    7.GBK编码:也就是扩展的 GB2312-80 国标内码 - GBK。GBK编码是四位十六进制数,GBK编码首字节范围为0x81 - 0xFE。尾
字节定义的范围为0x40 - 0x7E,0x80 - 0xFE。
    用户在输入GBK编码时,若恰好为四位,则查询结果至多只有一条。当输入不足四位时,系统将尽可能地从前向后匹配用户输入的
信息。对于许多的Unicode没有其对应的GBK编码。在Windows 98/me 操作系统中,只能使用GBK编码。不能使用没有GBK编码的扩展字
符集中的汉字。

    8.Unicode编码:Unicode标准[UNICODE]以及ISO/IEC 10646 [ISO-10646]共同定义了一整套编码字符(CSS),下文简称为Unicode,
它能适应世界上绝大多数的书写文字[WORKSHOP]。UTF-16是Unicode标准编码方式中的一种;它的特点是,能将所有预定义的字符(BMP
中的第一组)编码为2个字节,而将其他的字符(接下来的16组)编码为4个字节。Unicode编码是本系统中汉字在字库中的唯一索引码。
    很多Unicode编码在GBK字符集中没有定义,也就是说在Windows 98/me操作系统中以及更加古老的系统如DOS中,是不能够输入这
些在GBK字符集中没有定义的Unicode编码的汉字。在Windows 2000及其以上的版本如Windows XP中是可以使用这些Unicode汉字的,因
为这些系统提供了其相关的技术支持。

    关于Unicode编码的进一步的资料。(来源于Word 2003的帮助文件,有删改)
    国际标准化组织在 ISO10646-2000 的基本平面(BMP 或者 Unicode 3.0,下简称 Unicode)编入了27,564 汉字(U+4E00~U+9FFF
以及U+3400~U+4DFF),既是2000年3月在GB18030颁布时所建议支持的字汇。其中U+3400~U+4DFF部分的6582个汉字又称为扩展A。同时
国际标准化组织还在ISO10646-2000 的第二平面扩展了42,711汉字(又称为扩展B)。该42,711 汉字的编码表已基本确定,尽管不排
除未来微小变动的可能性。由于这42,711汉字编排在ISO10646-2000 的第二平面,所以编码需要4个字节。为了能够存取处理这些4字
节字符,在Unicode 中引入了Surrogate 机制(在ISO10646-2000中命名为UTF-16)。根据这样一种机制, 在Unicode中用两个16位编码
就可以对ISO10646-2000 第二平面中的汉字进行存取。
    Microsoft 从Windows 2000 (在Windows 98, Windows ME 及 Windows NT4 中没有)开始对这样一种机制提供支持。只要有相应的
输入法和字库并且在应用程序中给予相应的支持,就应该能够输入显示上述提到的汉字。但是,要想得到对Surrogate全面的支持(包
括在本帮助中能够正确显示),用户需先下载并安装Surrogate Package Surrogate 程序包。
    Microsoft 在中文简体版 Office 2003 及相应多语言包中,专门开发了超大字符集中文字体(宋体-方正超大字符集)。要安装宋
体-方正超大字符集,请在安装界面上选择Office共享功能 -> 中文字体 -> 中文超大字符集字体。如果您是从多语言包进行安装,请
在安装界面上选择Office Shared Features -> Chinese fonts -> Chinese Extended font。宋体-方正超大字符集字体包括了上面提
到的全部27,564个汉字以及在第二平面中(42,711)选出的36,862个在中国大陆,香港特别行政区(以及部分台湾地区)使用的汉字。因
此包括西文等常用字符在内,宋体-方正超大字符集共包括65,531个字符。
    利用微软拼音输入法 2003,用户可以通过输入汉字的Unicode(或Surrogate)来输入汉字。
    在Word 2003中,可以直接在Word 2003中输入Unicode码,然后按Alt+X转换成汉字。例如:Unicode编码是20000,则输入20000,
然后按Alt+X即可。要想知道每个字符的Unicode,也可以将光标定位在汉字后面,然后按ALT+X,相应的Unicode码则会显示出来。

    综上所述,通过各种条件限制查询,可以非常方便地查询到所需的汉字。希望我们的工作能给你带来愉快。

    二、查字举例:
   
    例 1. 欲查“镕”输入:笔画 [15] 拼音 [rong] 汉字分解 [容]
    例 2. 欲查“玥”输入:笔画 [ ] 拼音 [ ] 汉字分解 [王月]
    例 3. 欲查“羴”输入:笔画 [ ] 拼音 [ ] 汉字分解 [羊羊羊]
    例 4. 欲查“鉄”输入:笔画 [ ] 拼音 [ ] 汉字分解 [金失]
    例 5. 欲查“凫”输入:笔画 [ ] 拼音 [ ] 汉字分解 [鸟几]
    例 6. 欲查“鹏”输入:笔画 [ ]  拼音 [  ] 汉字分解 [鸟月月]
    例 7. 欲查“髓”输入:笔画 [20-22]  拼音 [ ] 汉字分解 [骨月工 ]
    例 8. 欲查“髓”输入:笔画 [  ]  拼音 [ ] 汉字分解 [骨月左]
    例 9. 欲查“亻”输入:笔画 [2 ]  拼音 [ren] 汉字分解 [     ]
    例10. 欲查“辶”输入:笔画 [3 ]  拼音 [ ] 汉字分解 [     ]

注意:笔画范围用 - 隔开。

不用考虑什么偏旁部首,只要是你能够打出来的汉字,哪怕是半个汉字,甚至是汉字中 包含的部分汉字都可以,我的软件都能查, 无论你在下面的输入框中输入什么字都行,不信你就试试!

汉字拆分查字法: 要查字"肗"在如下界面利用你熟知的输入法输入"月"和"女",

点击"提交查询"出现如下界面:

点击汉字"肗",则出现如下界面:

打开记事本或者是Word, 用鼠标选择"粘贴",界面如下: