族谱网 头条 人物百科

仓颉系统

2017-10-16
出处:族谱网
作者:阿族小谱
浏览:952
转发:0
评论:0
汉字检索的问题更多资料:汉字检索现时汉字的检索,在绝大多数地区都是以读音顺序为主。例如:日本的汉字检索,以五十音顺序而排列,韩国的汉字,以韩语字母顺序排列,中国的汉字,以汉语拼音顺序排列。汉字检索的最大难题,是不管用什么方法来实行,都要面对重码的问题。仓颉系统方案朱邦复在发展仓颉输入法时,原意是要发展“中文检字法”,使汉字具有“序位观念”,使中文能像拼音文字一般,用少数字母找到所有汉字。仓颉输入法的26个字码“日月金木水火土…卜”,其实正如同拉丁字母的26个字母“ABCDE…XYZ”、日本语的五十音序等,是有序的排列,可用于检索汉字,是以称作“仓颉字母”。事后他进一步扩充系统,提出汉字基因理论。由于字根都依汉字形声字特性分析得来,故若在电脑上运用这套方法,将有以下六大用途:仓颉系统即是将上列六大要素综合考虑而发展出的电脑系统。所解决的问题仓颉系统可解决下列各种问题:字序问题汉字字典依“部首...

汉字检索的问题

更多资料:汉字检索

现时汉字的检索,在绝大多数地区都是以读音顺序为主。例如:

日本的汉字检索,以五十音顺序而排列,

韩国的汉字,以韩语字母顺序排列,

中国的汉字,以汉语拼音顺序排列。

汉字检索的最大难题,是不管用什么方法来实行,都要面对重码的问题。

仓颉系统方案

朱邦复在发展仓颉输入法时,原意是要发展“中文检字法”,使汉字具有“序位观念”,使中文能像拼音文字一般,用少数字母找到所有汉字。仓颉输入法的26个字码“日月金木水火土…卜”,其实正如同拉丁字母的26个字母“ABCDE…XYZ”、日本语的五十音序等,是有序的排列,可用于检索汉字,是以称作“仓颉字母”。

事后他进一步扩充系统,提出汉字基因理论。由于字根都依汉字形声字特性分析得来,故若在电脑上运用这套方法,将有以下六大用途:

仓颉系统即是将上列六大要素综合考虑而发展出的电脑系统。

所解决的问题

仓颉系统可解决下列各种问题:

字序问题

汉字字典依“部首”、“笔划”检索没有效率,兼没“序位”观念,若以仓颉码排序汉字,则汉字的字序分明,人类或计算机程序查找汉字将方便快速许多。没有大五码和统一码字序混乱的缺点。

缺字和存储问题

   

电脑系统会有缺字问题,除了汉字的编码和查对旷日费时以外,字集的存储空间也是一大考量因素。目前主流的轮廓字体中,Times New Roman约占400KB,收字不足1,500;新细明体和细明体共约8.6MB,收字不到23,000字;标楷体约5.1MB,收字亦不到23,000。相较于拼音文字,由于汉字所需的存储空间庞大,许多小型的电子仪器不是无法收入汉字,就是缺字严重,如电子辞典、手机、各式医疗电子仪器等等。

由于仓颉码有前缀、字身的消息,汉字字形产生器可根据输入的仓颉码,把字根自动组合为字形,无需把每个字的字形逐一存储,大大减少所需记忆空间。由于输入输出统一以仓颉处理,取码与输出字形相符。

朱邦复在1995年开发的“汉字字形产生器”是依输入的仓颉码组合成字。该系统本身收录了已存在约六万古今汉字(前缀约六百,字身约一万);并且可根据仓颉组字规则类推,依已有的前缀、字身组合出“新字”近一千万。此系统共占160KB,在处理器速度450兆赫的电脑上,每秒可产生及显示16×16之字体46,000个。字体有明、黑、圆、宋、楷、隶等,并且能任意变化大小、笔划粗细、笔划填充。与当今字集相较,其效率相当惊人。

编码问题

一般的字集编码缺少扩充空间,新字只能加在不同的字面上,不同字面间的汉字排序非常混乱。朱邦复曾批评统一码处理汉字方法愚昧、收字不全、字序混乱、码长不等,认为不能采用。

仓颉系统采用一个字4字节(byte)固定码长的编码策略,一字共5个仓颉码(少于此数则补空码),一码占5比特(26个仓颉码、5个重复字处理码,加上空码共32个,即2的5次方),再加上数个辨识码组成。由于本身留下大量的编码空间,足够随时添加汉字至指定的编码位置(但实务上,若有重码则需另外处理),不同的字形对应的仓颉码也不同,不会有相异字形兼并为同一内码而带来麻烦。

输入问题

由于汉字表意特性强而表音特性弱,很多字没有明确的“标准读音”,或者标准读音常常变化;大多数的罕用字读音也很难被了解,因此音码无法全面解决汉字输入问题。此外,汉字同音字多,音码输入如果用于较大的字集,选字将严重影响效率。

朱邦复认为,中文输入必须要能够处理所有的汉字,因此编码时根据前缀、字身份析,以求仓颉码能反映汉字的组合特征。他同时也极力避免重码,这主要是为了编码和排序考量。相对而言,其他形码输入法主要着眼于易学易用及快速,仅针对常用字进行编码,对罕用字处理较粗糙,不是无法输入就是重码率高。

实际应用

朱邦复依仓颉系统的概念,设计出以下几套系统:

聚珍集成操作系统

聚珍集成操作系统于1989年推出市场,使用第五代仓颉,提供匹配汉字结构的字数百万,有七万为实际用字,整个系统连同各种程序只占450KB。因此,当系统发售时,一个A4纸长宽、十厘米高的盒子里,主要是使用手册,而整个系统只占用一片软盘片。即使是当时市面上功能最差的个人电脑,亦可以顺畅地运行。

人文系统

“人文系统”是一套于1999年起发展的非操作系统,且不对外发售。其为建构在MS-DOS上的软件系统,并由两项系统组成:

具图文功能的“图文系统”;

汉字处理功能的“仓颉系统”。

此系统是首套使用第六代仓颉(又称苍颉)的系统。由于有字序,即使数据库巨大,查寻速度仍然很快。灵活的字库,也让生僻字能如常处理。仓颉系统的优点得到发挥。

这套系统现时有北京的栾贵明教授用来建构其收录中国历代文献的,成品为汉文史数据库。

明珠中文系统

脱胎自聚珍中文系统,含明珠中文小字库。

理解系统

理解系统是仓颉系统的一部分。该系统将汉字使用4字节的固定长度编码,其中有1个“分类字符”,1个“区别字符”,和2个“定义字符”。采用固定长度编码的目的是为了能够快速方便地检索。

   

如此一来,32个比特便能表达无数多种的汉字字义,空间和时间效率都很高。举例来说,若要判断“逃”是否属于“生存类”,比对前3个比特是否等于110即可。

仓颉系统系采用汇编语言写成,可针对输入的文句产生联想推理的“概念网络”,根据这些对汉字的定义编码进行高速的复杂运算,进而理解一段中文的意思。 

图文系统

图文系统是理解系统的其中一种应用,该系统可以理解一段输入的中文文本,全自动产生一段动画。只须事先绘制必要的对象模型,以及设置数个基本的运镜参数即可。

朱邦复项目使用这个系统量产中文动画,以发扬中国文化。

示例:【记承天寺夜游】动画、剧本

仓颉码延伸的应用

形体相近的汉字的判断与汉字学习

将汉字的构造细分为主要成分,作为代表汉字的另一种内码,已经有许多相关研究。延伸仓颉码拆解汉字的精神,但是不采用仓颉输入法因限制一个汉字最多五码的限制而进行的省略动作,以比较详实的仓颉码来代表汉字的细部结构,进而比较汉字的近似程度。搭配汉字发音相同与相近的相关信息,基于汉字形体与发音近似的程度,可以猜测中文学习者的错字,作为学习汉字的辅助工具。

对仓颉系统的批评

一些人对仓颉系统做出以下的批评:

仓颉为了考虑按键的分配和重码率,不得不破坏汉字的理据拆分(如将“门”拆成“日弓”,但之间没有文字学的联系)。迁就了键盘,但失去了部件的教学和检字功能。

仓颉输入码在有理论上的极限值,32自乘5次。如果碰到新字,就必须回头修改仓颉系统的数据库,如果有重码,还要试图化解。还没换新版的仓颉之前,新字无法立刻呈现。

仓颉码只是字形的“特征取样”,舍弃了很多信息,往往造成例外和重码,使程序变得极为复杂而难以推广。

 


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱

更多文章

更多精彩文章
评论 {{commentTotal}} 文明上网理性发言,请遵守《新闻评论服务协议》
游客
发表评论
  • {{item.userName}} 举报

    {{item.content}}

    {{item.time}} {{item.replyListShow ? '收起' : '展开'}}评论 {{curReplyId == item.id ? '取消回复' : '回复'}}

    回复评论
加载更多评论
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回
打赏
私信

推荐阅读

· 仓颉
造字传说仓颉的壁刻,1931年完工,华盛顿哥伦比亚特区传说仓颉是黄帝的左史,发明文字,其助手右史沮诵记录下来时,鬼神夜间哭泣,认为人类即将变为狡诈。据历史记载:轩辕黄帝兴起之后,黄帝的史官仓颉、沮诵受鸟兽足迹的启迪,集中了劳动人民的智慧,呕心沥血数十载,搜集、整理流传与先民中的象形文字符号并加以推广和使用。绳结虽有大小和形状区别,但年久月深,难于辨识。后仓颉仰观奎星环曲走势,俯看龟背纹理、鸟兽爪痕、山川形貌和手掌指纹,从中受到启迪,根据事物形状创造了象形文字。遗迹与纪念山东寿光和东阿、河南开封、河南南乐、虞城、陕西长安和白水、河南阳武(今原阳县)、洛宁等地都有仓颉墓等遗迹。为了纪念仓颉造字之功,后人把河南新郑县城南仓颉造字的地方称作“凤凰衔书台”,宋朝时还在这里建了一座庙,取名“凤台寺”。在旧中国许多学校,都奉有“文字圣人仓颉先师”的神位,一般信仰虔诚,会与文昌帝君一同奉祀香火。其诞辰为农...
· 仓颉造字
仓颉,称苍颉,姓侯刚,号史皇氏,据说仓颉是黄帝时史官,曾把流传于先民中的文字加以搜集、整理和使用,在汉字创造的过程中起了重要作用,为中华民族的繁衍和昌盛作出了不朽的功绩。但普遍认为汉字由仓颉一人创造只是传说,不过他可能是汉字的整理者,被后人尊为“造字圣人”。今南乐县城西北35华里吴村有仓颉陵、仓颉庙和造书台,史学家认为仓颉生于斯,葬于斯。中国古书上有“结绳记事”、“契木为文”等记载,这是早期记事常用的方法,可惜这些物质无法长久保存下来,所以当时的记事情况已无法知晓了。但安阳小屯发现了十五万片甲骨卜辞,在龟甲与牛胛骨上刻的文字相当完好地保存了下来,总字数达到3500个上下。从甲骨文字结构来说,除了象形以外,形声、会意、假借等比较进步的造字方法已普遍被应用。可见在三千余年前的商代文字已达到了相当完备程度,那幺在它以前一定有个更长的发展过程。考古发现证明,中国先民早在七、八千年前就在龟甲上刻划符...
· 仓颉怎么读?谷雨祭祀仓颉习俗的由来探寻
仓颉我们知道是我国上古时期原始象形文字的创造者,汉语拼音中“仓颉”两个字拼写上读作“cāngjié”,仓颉原姓侯冈,又史皇氏,又曰苍王、仓圣。从传统民族习惯中往往会在清明祭黄帝,谷雨祭仓颉,可以说在谷雨这个农历节气祭祀和纪念仓颉是自汉代以来就有的民间传统习惯,也是一种文化信仰,有着上千年的历史文化,从古代文献《淮南子》记载的来看,在谷雨这一天祭祀仓颉,其实是因为谷雨这一天和仓颉有着很多的联系,传说黄帝在春末夏初发布诏令,宣布仓颉造字成功,在当天下了一场“谷子雨”,吓得“鬼怪”在夜里啾啾地哭起来。《淮南子》中“天雨粟,鬼夜啼”的描述记载便是关于这段故事。据《世本》、《说文解字》、《淮南子》等古本记载,仓颉是黄帝时期造字的左史官,他在造字的过程中受到了鸟兽足迹的启发而分类、整理,在汉字的创造过程中起到了一定的作用,古代仓颉造字的成功也标识“结绳记事”传统习俗的结束,在后世,每年谷雨的这天中,在...
· 仓颉庙的传说
仓颉庙飞檐斗拱,气势恢宏,无与伦比。至于仓颉庙的来历,没有八能说得清是何朝何代何人所建。有民谣曰:"仓颉庙,仙人建,万民之尊惊动天。"据说仓颉弃绳造字,开宇宙浑沌,别人生愚昧,世界为之晴朗。华夏步入文明,仓颉活了一百一十一岁,一生创造的字可以用车载斗量。仓颉死后,百姓非常怀念他,而当时在任的一位官员对造字圣人更是尊崇之极,欲合民意修建仓颉庙,但又忧虑百姓生活之艰辛,不忍与子民增加负担。该官每日冥想,不得妙计,遂成心病。忽一日睡觉时梦见一仙人说:"你尊于圣,忧于民,心诚哉也!告诫你的百姓不要出门,不出三日,仓颉庙即可建好。"这个官醒来半信半疑,但又渴望美梦成真,于是便下令仓陵周围村庄百姓不得出门,其他地方的人,也三天之内不许到仓陵去。第二天,天空中狂风呼啸,乌云翻滚,刮起了黑风。大风来势凶猛,飞沙走石,刮得天黑地暗,一气刮了三天三夜还不停点。这时,史官村有一拾粪老汉,一生勤劳惯了,三天不出门...
· 部落首领仓颉
简要介绍:仓颉,原姓侯冈,名颉,俗称仓颉先师,又史皇氏。《说文解字》记载仓颉是黄帝时期造字的左史官,见鸟兽的足迹受启发,分类别异,加以搜集、整理和使用,在汉字创造的过程中起了重要作用,被尊为“造字圣人”。仓颉,原姓侯冈,名颉,俗称仓颉先师,又史皇氏。《说文解字》记载仓颉是黄帝时期造字的左史官,见鸟兽的足迹受启发,分类别异,加以搜集、整理和使用,在汉字创造的过程中起了重要作用,被尊为“造字圣人”。据《河图玉版》、《禅通记》记载,仓颉曾经自立为帝,号仓帝,是上古时期的一部落首领。仓颉在位期间曾经于洛I之水拜受洛书。仓颉也是道教中文字之神。据史书记载,仓颉有双瞳四个眼睛,天生睿德,观察星宿的运动趋势、鸟兽的足迹,依照其形象首创文字,革除当时结绳记事之陋,开创文明之基,因而被尊奉为“文祖仓颉”。根据历史文献记载,一些文献记载仓颉为黄帝左史官,为造字圣人;另有文献记载仓颉为部落首领,曾自立为帝拜受洛...

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信