goback
月期刊咨询网
当前位置:首页>>电子技术论文>>正文

基于胶囊网络与深度置信网络融合模型的手写汉字识别


所属栏目:电子技术论文
发布时间:2021-10-20 11:29:21  更新时间:2021-10-20 11:29:21

已签订领域:化学工程/制药,医学题目:**作为抗癌剂***催化剂**取代苯丙***SCI四区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:用**电***生物传感器**癌症**SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:**氧化石墨烯纳米***材料的生物传感器***结肠癌生物**癌胚****SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:聚合物纳米***a-硫辛酸***在神经炎症***应用***临床分析SCI二区 直击了解更多选题

已签订领域:计算机视觉/遥感/智能驾驶/汽车题目:**深度学习***高分辨率遥感***车辆检***SCI三区 直击了解更多选题

已签订领域:企业管理题目:社会交流***领导***倾向***方向SSCI,SCI三区,二区 直击了解更多选题

已签订领域:企业管理题目:**中小企业社交媒体****可持续绩效***因素探析SSCI,SCI三区,二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:利用硫氨酸***石墨烯纳米***电化学***传感器实现癌胚抗原***SCI二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:基于抗***纳米复合***高性能***早起癌症诊断***SCI二区 直击了解更多选题

已签订领域:经济,能源题目:***政治冲突****绿色金融、金融**、气***化***SCI四区 直击了解更多选题

已签订领域:经济,能源题目:冲***中能源不安全对***和环境***SCI四区 直击了解更多选题

已签订领域:教育题目:大学生***社交媒体***成绩影响***SSCI三区 直击了解更多选题

已签订领域:教育题目:巴基斯坦***学习实施的***的**SSCI二区 直击了解更多选题

已签订领域:教育题目:大学生对****下网络教学**思***SSCI二区 直击了解更多选题

已签订领域:教育题目:**教师和学生对影响***医疗**效果的****看法SSCI三区 直击了解更多选题

已签订领域:计量经济学题目:**货币、黄金、**和美国***的波动***相互依赖性:**数据的分析SSCI一区 直击了解更多选题

已签订领域:计量经济学题目:东南亚***内**趋同***中等收入**:新**的***SSCI二区 直击了解更多选题

已签订领域:建筑,历史题目:历史景点在***旅游发***中的***影响**(**研究:**历史***)SSCI,SCI一区 直击了解更多选题

已签订领域:领导力,管理题目:量化**领导对角色绩效***响:**冲突与工作自主性***作用SCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:数字***环境对学生学习成绩***:游戏**和***现实在教育***作用SSCI四区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***续决策之间的***:创新***识的**作用SSCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:课程**对大学生***发展的影响:学习习惯和***的***作用SSCI一区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***与可持续决策**:高等***学生认知***作用SSCI二区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语****学**与人工智能****学习SCI三区 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐**对学生成绩***的影响SCI三区 直击了解更多选题

已签订领域:人体工程,心理学题目:基于预先处理模型***模式人体工程学***女生肌肉骨骼***预防行为*** 直击了解更多选题

已签订领域:人体工程,心理学题目:制定一个***人体工程学**,以识别、优先考虑***职业压力源的*** 直击了解更多选题

已签订领域:人体工程,心理学题目:多重工作**压力和工作***:***工效学方法的混合方法*** 直击了解更多选题

已签订领域:数学,经济题目:数学模型***结构调整和经济转型****研究 直击了解更多选题

已签订领域:数学,经济题目:***时间**数学模型在***媒体营销**中的应用*** 直击了解更多选题

已签订领域:数学,经济题目:***时间**模型在***物流运**能力***研究 直击了解更多选题

已签订领域:数学,经济题目:碳****经济的数学模型****研究 直击了解更多选题

已签订领域:农村经济题目:农****社区**发展***分**SCI四区 直击了解更多选题

已签订领域:农村经济题目:创业***对乡村****发展的****SCI四区 直击了解更多选题

已签订领域:农村经济题目:农村创业****的空间*****究SCI四区 直击了解更多选题

已签订领域:医学,电化学题目:纳米颗粒*****及其在癌症****和重金属*****检测中的应用SCI三区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****前列腺癌药物氟****检测方法的*****腺癌治疗SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:气海***********金纳米颗粒的新型****************粘土及其对胃癌********************抗癌SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于抗***********GCE纳米***********材料的高性能*******************早期癌症SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:用******电化学生物传感器*****癌症***************SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****石墨烯纳米****材料的生物传感******用于测定结肠*****生物*****SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:聚合***纳米复合电极*****疏辛酸电化学检测*********SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:利用****酸/**糖**石墨烯纳米复合修饰的电化学*****SCI二区 直击了解更多选题

已签订领域:环境能源,绿色投资题目:环境能源、绿色投资、城市化和环境类方向SCI三区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语教学**人工智能***习SCI 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐形式*学生***影响SCI三区 直击了解更多选题

已签订领域:经济,绿色投资题目:***能源效率***化之间的***SCI三区 直击了解更多选题

已签订领域:经济政策题目:***阐明**印度经济***的关系SCI三区 直击了解更多选题

已签订领域:经济,金融题目:***国家的能源***重***SCI 直击了解更多选题

已签订领域:经济,金融投资题目:***融新之间***直接投资***SCI三区 直击了解更多选题

已签订领域:经济,数学,统计学,管理学题目:非***想重限制下***袭评价***SSCI四区 直击了解更多选题

已签订领域:经济,数字,管理学题目:基干***生产系统***SSCI四区 直击了解更多选题

已签订领域:农业,土壤科学题目:不同***有机覆盖***养分循环SSCI 直击了解更多选题

已签订领域:电力与能源系统,管理题目:pv***氢定价的***随***型稀SSCI,SCI二区 直击了解更多选题

已签订领域:建筑规划,计算机题目:使用***因子分析法***可持续***SCI三区 直击了解更多选题

已签订领域:工程技术,纺织工程,材料科学题目:甘***淀粉酶的提取***退浆中的应用SCI四区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:饲料***镉毒性的交互***生长***病理学***SCI二区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:****鱼水源***起的生******SCI三区 直击了解更多选题

已签订领域:金融,环境经济题目:*****预算在能效、绿色***的作用SCI 直击了解更多选题

已签订领域:应用数学/计算物理题目:***非线性库***自相位调制***SCI三区 直击了解更多选题

已签订领域:计算机,医学检测题目:***COVID-19***力***算法***决策SCI三区 直击了解更多选题

已签订领域:计算机,物联网,智慧城市题目:基于***物联网****算法SCI三区 直击了解更多选题

  针对离线手写汉字的特征提取困难、不能准确识别等问题,提出了一种胶囊网络与深度置信网络的融合模型。首先从CASIA-HWDB1数据集中随机选择了一些文本分别训练胶囊网络和深度置信网络,然后采用胶囊网络和深度置信网络的融合策略进行了手写汉字识别实验。实验结果表明,在不确定方向上使用汉字融合模型的错误率降低了5.2%,与单独使用胶囊网络和深度置信网络相比,具有更好的识别效果。

基于胶囊网络与深度置信网络融合模型的手写汉字识别

  1引言(Introduction)

  汉字识别的研究涉及人工智能、模式识别、图像处理、统计决策理论等学科,在办公、银行、邮政等自动分类领域具有重要的理论意义和实践价值[1]。汉字识别可分为印刷汉字识别和手写汉字识别两大类。手写汉字识别可分为在线手写汉字识别和离线手写汉字识别。在线汉字识别是指在通过触摸屏等输入设备手写汉字过程中,计算机根据书写汉字的笔画走向、笔画顺序、书写速度等多种信息进行识别,由于信息量多且具有连续性,因此识别难度较小,识别准确率也较高[2]。离线汉字识别提供的信息量少,仅仅通过识别一个汉字的二维图像来提取汉字特征,所以识别难度较大,识别准确率也较低[3]。各大高校和研究所致力于汉字识别的研究,由于汉字具有类别多、字形复杂、相似等特点,因此每个人手写汉字千差万别,导致手写汉字识别困难,故手写汉字识别一直是研究的热点和难点[4-5]。手写汉字识别是一个极具挑战性的模式识别与机器学习问题,特征如下:一是汉字类别中的汉字数量很多。二是字体结构复杂。三是字形变化很大。离线手写汉字主要用在日常生活中。手写字是任意的,缺乏规范性,水平、垂直、点等笔触容易变形,例如笔直变弯,笔触成圆弧,短横、短竖成点等。四是有很多类似的词。汉字集合中有很多相似词,如:“已—己—巳,盲—肓,兔—免”等,可能由于预处理不当从而导致字符错误。总之,诸多研究人员已经做了大量的离线手写汉字识别工作。针对离线手写汉字识别的难点,文献[6]提出了一种CNN-DBN手写汉字融合模型,比单独分别使用CNN和DBN的识别效果好。文献[7]从GoogLeNet网络构建了卷积神经网络,并使用随机弹性变换算法扩展了训练数据。文献[8]结合ResNet网络,通过使用作业图像中汉字笔迹测试结果中的每个有效检测区域作为输入,实现基于深度学习模型的汉字笔迹识别。文献[9]提出了一种基于PCCG-GAN的手写汉字归一化方法,实现了从手写到打印的汉字生成任务。利用对称网络提取手写汉字多尺度信息并进行特征融合,减少了输入输出之间共享的底层信息量,减少了欠采样过程中信息的丢失。文献[10]由于卷积神经网络对手写汉字的识别速度较慢,二维主成分分析(2DPCA)和卷积神经网络相结合来识别手写汉字与基于Alexnet的CNN模型相比,时间减少了78%,与基于ACNN的模型相比,时间减少了80%。文献[11]针对传统手写汉字识别特征提取过程复杂、识别率低、分类模型能力弱的问题,设计了一种多通道交叉融合的深度残差网络模型,并设计了中心损失函数,比之前的算法提高了2.3%识别率。近年来,随着深度学习的兴起和不断发展,各种智能算法在计算机视觉领域取得了突破性的成果,使得手写汉字的识别率也越来越高。为了进一步探索线下手写汉字的识别方法,本文拟提出一种胶囊网络与深度置信网络融合的识别模型,以提高手写汉字的识别能力。

  2相关工作研究(RelatedWorkResearch)

  2.1胶囊网络

  Hinton等人在2017年提出了胶囊网络(CapsuleNetwork,CapsNet)。CapsNet是建立在卷积神经网络(ConvolutionalNeuralNetworks,CNN)基础上的图像分类识别技术,CNN的缺陷是对于物体间的空间识别能力及物体旋转后的识别能力不强,而CapsNet能很好地解决这两个问题,如图1所示。CapsNet结构层次浅,由卷积层、主胶囊层、数字胶囊层构成,其结构如图2所示。传统的神经网络是由神经元组成的,神经元表示对象中的各种属性。胶囊(Capsule)称为向量神经元,向量长度表示对象存在的概率,向量方向表示对象的属性,它包含多个神经元。CapsNet用胶囊代替传统神经元,它的输入输出都是一个向量。低层封装需要将输出传递给该输出的高层封装。具体地说,路由数据的传输是通过低层胶囊的输入与高层胶囊的输出的相似性来确定的。如果低层胶囊的预测矢量与高层胶囊的有效矢量具有高度相似性,则表明这两个胶囊高度相关。CapsNet中使用了迭代动态路由算法,以与输出向量相似的方向在胶囊中获取向量,并且与向量的数量和模块的长度呈正相关。为了避免将内部乘积用作无上限情况的度量,将矢量压缩到输出之前。

  2.2深度置信网络

  深度置信网络(DBN)由多层有限Boltzmann机器(RBM)和一层分类器组成,经典的DBN网络结构是由多层RBM和一层BP组成的深度神经网络。该深度模型广泛应用于图像分类识别、语音识别等领域。DBN是基于生物神经网络的研究和浅层神经网络的发展而来的,并且从联合概率分布中推断出概率样本模型的数据样本分布。DBN生成模型通过训练网络结构中神经元之间的权重,整个神经网络根据最大概率生成训练数据,形成高级抽象特征,并提高了模型的分类性能。DBN使用自下而上的传输,底层神经元接收原始特征向量,不断抽象到更高的水平,顶层神经网络形成易于组合的特征向量。通过添加层,可以抽象出更大的特征向量,并且网络的每一层都会削弱前一层的错误信息和辅助信息,以确保深度网络的准确性。DBN结构如图3所示。受限的Boltzmann机器由两个神经元节点组成,即隐藏层和可见层。2.2.1受限玻耳兹曼机(RBM)。首先,DBN模型是基于人工神经网络的,由接收输入数据的显性神经元和特征提取的隐性神经元组成。DBN的关键组件是RBM,它通过将多层RBM与最终分类器结合在一起来检测、识别和分类输入数据。RBM组成结构包含两层神经元,每一层都可以由一个向量表示,向量的维数由每一层中神经元的数量确定,如图4所示。由图4可知,为了保证层中神经元的独立性,RBM各层中的神经元之间无连接,层间神经元双向连接,即与给定元素相对应的隐藏元素的值无关,并且当该元素被赋予隐藏元素值时,将保留相同的特性。2.2.2DBN模型的构建。DBN就是一些堆叠在一起的RBM,前一个RBM的输出就是后一个RBM的输入。本文以两层RBM和Softmax分类层为例构建DBN模型。如图3所示,v代表显示层神经元,h代表隐藏层神经元,y代表标签已知的样本,o代表分类结果输出。DBN模型的构造如下:固定第一个训练后的RBM的权重和偏差,将其隐藏元素的状态作为第二个RBM的输入;训练后将第二个RBM堆叠在第一个RBM上;重复上述过程进行多次逐层学习。如果训练数据集包含标记的样本,则需要在第二次RBM训练期间将其添加,最后使用Softmax对数据进行分类。深度置信网络在检测识别领域的应用效果分析,如表1所示。样本数据主要是手写数字、频谱图像和语音。

  2.3CapsNet与DBN融合模型

  CapsNet模型和DBN模型都可以应用于线下手写汉字识别任务,CapsNet解决了CNN的缺点,能捕捉特征位置、相对大小、特征方向等属性间的关系。DBN通过采用逐层训练的方式为整个网络赋予了较好的初始权值,以重构数据为目标,使网络只要微调就可以达到最优解,这在无监督的环境中是非常有用的。由于CapsNet和DBN网络结构不同,因此提取特征的优势不同,如字形特征不明显,或与其他字形相似,那么不同的人识别的结果可能也不一样。本文提出的CapsNet和DBN融合模型结合了两者的优势,比单独使用CapsNet和DBN识别汉字具有更高的识别能力,这种模型称为CapsNet-DBN融合模型,包括训练和识别过程,如图5所示。

  3仿真与测试(SimulationandTest)

  3.1实验准备

  使用数据集CASIA-HWDB1.1进行训练和测试,该数据集于2010年5月公布,为手写单字,分别由300人书写,包含171个英文数字符号,3,755个GB2312一级汉字,共300套,总计1,172,907个有效样本。表2列出了CapsNet-DBN模型中的各层参数。

  3.2实验结果与分析

  本文实验环境:Windows1064位操作系统,处理器为Intel(R)Core(TM)i7-6500UCPU,主频为2.5GHz,内存为16GB,实验平台为Python3.8版本。实验数据来自。表3为CapsNet网络、DBN网络及其融合网络的准确率。CapsNet、DBN、CapsNet-DBN对不同写法的汉字识别能力的比较如图6所示。图7表明三种算法对不同汉字的识别能力,CapsNet-DBN在大部分情况下都比CapsNet和DBN对不同汉字的识别能力要高。图8和图9分别显示了CapsNet-DBN网络训练过程准确率和训练损失。Fig.9LossofCapsNet-DBNnetworktrainingprocess使用相同数据集验证并比较表1中的各种模型算法和本文所述的融合模型的识别准确率,从表4中可知,ResNet-BLSTM+DBN方法对手写汉字的识别效果良好,本文提出的CapsNet-DBN融合模型也可以获得较高的精度。本文在CapsNet-DBN模型的基础上尝试增加隐藏层和隐藏单元数目及在不同的迭代次数中进行测试,分别增加了隐藏层个数及隐藏单元数。图10(a)隐藏层参数为(32*3*3)-(16*2*2)-(2*2)-(2*2)-(64*2*2)-(2*2)-(512),图10(b)隐藏层参数为(32*3*3)-(2*2)-(16*2*2)-(2*2)-(32*2*2)-(2*2)-(64*2*2)-(2*2)-(512),图10(b)比图10(a)增加了2个隐藏层。图11(a)隐藏层参数为(32*3*3)-(2*2)-(32*2*2)-(2*2)-(96*2*2)-(2*2)-(128*2*2)-(2*2)-(512),图11(b)隐藏层参数为(32*3*3)-(2*2)-(64*2*2)-(2*2)-(96*2*2)-(2*2)-(128*2*2)-(2*2)-(512),图11(b)其中一个隐藏层单元数为图11(a)的2倍。实验结果说明了隐藏层个数和隐藏单元数目的增加可以将大量信息扩展到维度较大的中间空间,这样会将模型的验证精度提高7.2%。当然,隐藏层个数和隐藏单元数目也不是越多越好,需要根据具体问题进行调整。

  4结论

  (Conclusion)本文针对离线手写汉字的特征提取困难、不能准确识别等问题,提出了一种胶囊网络与深度置信网络的融合模型,从CASIA-HWDB1.1数据集中随机选择了一些文本进行手写汉字识别实验。实验结果表明,与单独的CapsNet和DBN及传统的机器学习方法相比,CapsNet-DBN融合模型在数据集上获得了更好的识别结果。

  作者:管小卫 丁琳

  基于胶囊网络与深度置信网络融合模型的手写汉字识别相关推荐汉字形体演变途径



  • 速看!审稿出版最快的教育学SSCI期刊及选题推荐

    2025-02-21
    在教育学领域,被ssci收录的期刊众多,想要选择审稿出版快的期刊,对于新手作者来说确实很难,而且出版周期长短与论文质量、期刊的影响力等因素有直接的关系。今天在这里为大家汇总整理了部分 审稿出版最快的教育学SSCI期刊及选题 ,供大家参考: 一、审稿出版最快的教
  • 医学生含金量高的学术期刊汇总

    2025-02-21
    医学生毕业发表含金量高的学术论文,不仅要选择含金量高的期刊,而且还要确保论文符合期刊的要求,提高论文发表期刊的几率。以下是为大家整理汇总的部分 医学生含金量高的学术期刊 ,供大家参考: 四大医学期刊: 《新英格兰医学杂志》(NEJM):综合性医学期刊,侧重
  • 腾讯公司!捐赠5亿元给国家自然科学基金委员会,资助博士研究生项目

    2025-02-21
    2月18日,国家自然科学基金委员会微信公众号发布消息称,国家自然科学基金委员会日前与腾讯公司正式签约,腾讯公司向国家自然科学基金委员会无偿捐赠5亿元,用于资助 青年学生基础研究项目(博士研究生项目), 重点支持其中女性、西部、粤港澳大湾区获资助者开展基础研
  • 2025年国自然选题和撰写申请书技巧

    2025-02-21
    2025年申请国家自然科学基金(国自然)时,对于申请国自然的作者来说,选题和撰写申请书的技巧至关重要。那么,以下是一些关键点和策略,帮助你优化 2025年国自然选题和撰写申请书技巧 ,供大家参考: 一、2025年国自然选题技巧 (1)紧跟国家战略需求和政策导向 在做
  • 避雷!2025国自然各学部不予资助这些领域,千万别中招!

    2025-02-20
    管理科学部 为优化国家自然科学基金资源配置,保证项目负责人有精力完成好已承担的国家项目,除本《指南》特别说明之外,2025年度本科学部不受理下列申请人的项目申请 (优秀青年科学基金项目和国家杰出青年科学基金项目申请人除外 【编者注:即青年科学基金项目A类和B
回到顶部