教育艺术杂志基于数学原理构建汉字拼音笔画输入体系
所属栏目:高等教育论文
发布时间:2016-01-06 18:34:01 更新时间:2016-01-06 17:02:59
在一些自动化或者计算机研究中都会用到一些数学原理,数学也是一门科学,本文主要针对基于数学原理构建汉字拼音笔画输入体系进行了一些研究,文章是一篇教育艺术杂志社投稿的论文范文。
【摘要】随着互联网普及和我国对汉字的逐渐重视,依靠排列组合原理,利用一种新的汉字输入法――拼音笔画输入法,解决重码和读音不准问题,科学构建汉字字库系统、汉字单字或多词组应用数据分析系统和汉字信息快速搜索系统,使汉字发展能更好地适应新形势所需.
【关键词】拼音笔画,数学,体系构建
一、数学聚集整合技术的应用
英国著名科学家李约瑟编撰的《中国科学技术史》一书,曾这样说过:中国是最早发明水排的国家,也是最早发明风箱的民族,但却没有把它们整合起来变成蒸汽机.其原因是没有最终把两者有机整合在一起.
说起蒸汽机,首先想到瓦特,但他并不是发明者.瓦特的重大贡献就在于技术改进,且运用数学原理,经过反复实验、计算得出运行效率高于以往四倍的结果,使蒸汽机性能大大提高,从而促进了第一次工业革命的兴起.下面介绍的拼音笔画输入法,就是利用了聚集、整合技术和数学方法构建的.
二、拼音笔画输入法
我们知道汉语拼音是由声母和韵母组合而成的汉字字音,而拼音笔画输入法是利用拼音声母与汉字笔画相结合来实现的.汉语拼音总共有23个声母,汉字笔画可分为五种:横、竖、撇、捺、折,可以用键盘数字1、2、3、4、5代替.每一个汉字都是由声母与笔画组合而成,根据数学中排列组合乘法定理,可以计算出总组合数来.现将乘法定理叙述如下:
完成一件事,需要将其过程分成几个步骤,做第一步有m1种不同的方法,对于第一步的每一种方法,做第二步均有m2种不同的方法;对于前两步的每种方法,做第三步有m3种方法……以此类推,做第n步,对于前(n-1)步的每种方法,均有mn种方法,那么完成这件事共有P=m1*m2*――*mn种不同的方法.
1.汉字的单字输入法
规则:取声母232取笔画53
笔画取法:上下结构的汉字取第一、第二笔画和末笔画;左右结构的汉字取左侧的第一笔画和右侧的第一笔画及末笔画;不够三笔的汉字用空格代替.
声母与笔画总组合数为:232*53=2875种
例如:汉 h454 字 z421
需要说明,不是每一种声母与笔画的组合都可以组成一个汉字,但是每一个汉字都是由声母与笔画组成,这里的总组合数为平均数.根据国家公布《通用规范汉字表》(2013版),共收录汉字8105个左右.假设每一个声母和笔画都可以组成一个汉字,那么平均重码率8105/2875≈3个汉字.从理论上来讲基本上满足我们使用要求,不翻页或少翻页找字,极大地节约了输入汉字的时间.
2.汉字的双字词组输入法
规则:取声母组合数232 取笔画组合数52
笔画取法:取第一个字的第一笔画与第二个字的最后一笔.
双字词组总组合数为:232*52=13225
例如:科学kx32 东西dx11
根据《现代汉语词典》词汇总量约六万条,其中双字词组不超过四万条,汉字平均重码率40000/13225≈3个字,同样也节省了汉字双字词组输入的时间.
3.汉字的三字词组输入法
规则:取声母组合233 笔画输入52
笔画取法:取第一个字第一笔,最后一个字末笔画.
汉字三字词组总组合数为233*52=304175
例如:俄罗斯 els32
汉字三字词组基本上不存在重码,大多不需要翻页.
4.汉字四字词组输入法
规则:直接输入声母,笔画输入基本上不需要采用.
四个字声母组合数234=279841
例如:一针见血yzjx 一心一意yxyy
五个字及其以上的词组(容量235=6436343)只要使用声母就可以完成汉字词组的输入,不需要再输入笔画,这样输入速度更加快捷方便.
三、拼音笔画输入法特点
从以上对汉字单字及词组进行计算与分析,得出规律为:汉语拼音的声母用来输入汉字或词组,笔画用来确定矫正每一个汉字或词组.当输入四个字及其以上的词组时,根据其组合容量,基本上不需要输入笔画,这样极大地减少了敲击键盘的次数,使输入词组更加快速方便.拼音笔画输入法还有以下一些特点:
1.减少敲击键盘的平均次数
以拼音输入为例,输入一个汉字,最少敲击2次键盘 (不算重码翻页)(壹yi),最多敲击6次键盘(状zhuang),平均输入键盘3.5次。
从上表中可以看出,采用拼音笔画输入法,敲击键盘的次数明显减少.
2.解决汉字读音不准的问题
地区方言差异较大,声母不易读准的音zh、ch、sh与z、c、s;韵母不易读准的音en、eng、in、ing,这些不容易读准的声母和韵母在汉字中占有很大比例,由于读音不准确,导致在拼音输入过程中输入速度受到影响.
3.解决汉字输入过程中的重码问题
无论是使用拼音输入法还是笔画输入法都存在大量的重码,但把两种输入法结合起来,就大大地降低了重码率,节约输入时间,从而使汉字输入更加简便、快捷.
4.加深人们对汉字字型的印象
汉字是语言与字型完整结合的产物,这是汉字文化固有特点,使用这种输入法,可以加深对中国传统汉字字型的记忆印象,加强对中国汉字书写与阅读的继承与发展,具有不可替代的意义. 5.推进汉字输入法的延伸和扩展
汉字的字形结构形式比较复杂,它不仅有上下、左右结构,还有许多字形结构形式,如里外型(国)、品字型(森)、倒品型(馨)及独体字型(凸、凹)等,为了减少重码,增加几个常用字根以及相对应的数码,使输入汉字更快捷.所增加的字根及数码键盘对应如下:
键盘0:口、日、目、月、田、�等,此类部首占汉字总量16%~20%左右.
例如:国g014 、 启q450 、曼m004 、眼 y054
键盘7:七、土、士、扌、艹等,此类部首占汉字总量10%左右;
例如:草c702 、地 d757 、把b757、北b217
键盘8:八、�W、人、�R、灬.小等,此类部首占汉字总量10%左右.
例如:放f438 、然r348 、众z888、兑d805
增加的3个数码,其拼音与笔画组合数为:23*83=11776.重码率为8000/11776≈0.68%
四、建立与时俱进的汉字输入应用体系
汉字拼音笔画输入法被大家认同需要一个过程.但它应用数学原理建立起来的数学体系非常重要.马克思说:“一门学科只有当它达到了能够成功运用数学时,才能真正发展”.数学原理的引入为我们在工作中解决实际问题提供了理论依据,它揭示了事物内在规律,化难为易,把奥妙变为常识.为此,拼音笔画输入法的应用又进一步拓展了空间.
1.建立属于自己的汉字字库系统
由于每个人使用汉字的用途及专业分类领域不同,使用汉字单字和词组的频率也不尽相同.因此,有必要组建属于自己的汉字字库系统,从字库系统中提炼出属于自己的汉字字库,再结合汉字输入过程中的联想功能和学习记忆功能等,以便更好地为我所用.例如:普通人手机微信、短信交流,约3000~3500个常用汉字足够用,但是研究中国古代汉语的,约需要1.5万个汉字,作为医生除了常用汉字外,还需要在字库里储存较多专业名词或大量的药品名称等.
2.建立汉字单字或多词组应用数据分析系统
汉字与英文单词有很大不同,英语由26个字母组合成单词,而汉语是由单字与词组组合而成,而且每一个单字又可以组合成词组,这就造成汉字的新词组不断涌现.我们有必要建立汉字应用数据分析系统,对汉字或词组的使用频率、新旧词组的增减、汉字字库的容量等进行科学统计,利用统计结果对汉字的使用情况进行分类,把汉字进行数字化、科学化的整理,让汉字更好地为各行各业人群服务.
3.建立快速汉字信息搜索系统
我们在网上搜索信息时,一般需要将汉字信息全部输入,方可查寻到此类信息.如果我们建立快速汉字信息搜索系统,根据声母的排列组合的组合数容量,5个字以下利用声母与笔画相配合查找,五个字以上的,直接输入声母就可以非常快速查询到此类信息.此方法非常适合图书馆的信息检索系统.
基于数学原理的拼音笔画输入法,不仅是一门汉字输入技术,而且能使汉字体系进一步深化,为快速发展的各个领域提供更好的服务.
相关期刊简介:《数学理论与应用》(季刊)创刊于1981年,是由中南大学主管、湖南省数学学会主办的数学理论与应用性期刊。《数学理论与应用》现用名《湖南数学年刊》,办刊宗旨:发表数学研究成果,促进学术交流。
月期刊平台服务过的文章录用时间为1-3个月,依据20年经验,经月期刊专家预审通过后的文章,投稿通过率100%以上!