goback
月期刊咨询网
当前位置:首页>>智能科学技术论文>>正文

科技论文基于属性模式的实体识别框架


所属栏目:智能科学技术论文
发布时间:2014-03-26 14:43:46  更新时间:2014-03-26 14:55:45

已签订领域:化学工程/制药,医学题目:**作为抗癌剂***催化剂**取代苯丙***SCI四区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:用**电***生物传感器**癌症**SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:**氧化石墨烯纳米***材料的生物传感器***结肠癌生物**癌胚****SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:聚合物纳米***a-硫辛酸***在神经炎症***应用***临床分析SCI二区 直击了解更多选题

已签订领域:计算机视觉/遥感/智能驾驶/汽车题目:**深度学习***高分辨率遥感***车辆检***SCI三区 直击了解更多选题

已签订领域:企业管理题目:社会交流***领导***倾向***方向SSCI,SCI三区,二区 直击了解更多选题

已签订领域:企业管理题目:**中小企业社交媒体****可持续绩效***因素探析SSCI,SCI三区,二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:利用硫氨酸***石墨烯纳米***电化学***传感器实现癌胚抗原***SCI二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:基于抗***纳米复合***高性能***早起癌症诊断***SCI二区 直击了解更多选题

已签订领域:经济,能源题目:***政治冲突****绿色金融、金融**、气***化***SCI四区 直击了解更多选题

已签订领域:经济,能源题目:冲***中能源不安全对***和环境***SCI四区 直击了解更多选题

已签订领域:教育题目:大学生***社交媒体***成绩影响***SSCI三区 直击了解更多选题

已签订领域:教育题目:巴基斯坦***学习实施的***的**SSCI二区 直击了解更多选题

已签订领域:教育题目:大学生对****下网络教学**思***SSCI二区 直击了解更多选题

已签订领域:教育题目:**教师和学生对影响***医疗**效果的****看法SSCI三区 直击了解更多选题

已签订领域:计量经济学题目:**货币、黄金、**和美国***的波动***相互依赖性:**数据的分析SSCI一区 直击了解更多选题

已签订领域:计量经济学题目:东南亚***内**趋同***中等收入**:新**的***SSCI二区 直击了解更多选题

已签订领域:建筑,历史题目:历史景点在***旅游发***中的***影响**(**研究:**历史***)SSCI,SCI一区 直击了解更多选题

已签订领域:领导力,管理题目:量化**领导对角色绩效***响:**冲突与工作自主性***作用SCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:数字***环境对学生学习成绩***:游戏**和***现实在教育***作用SSCI四区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***续决策之间的***:创新***识的**作用SSCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:课程**对大学生***发展的影响:学习习惯和***的***作用SSCI一区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***与可持续决策**:高等***学生认知***作用SSCI二区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语****学**与人工智能****学习SCI三区 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐**对学生成绩***的影响SCI三区 直击了解更多选题

已签订领域:人体工程,心理学题目:基于预先处理模型***模式人体工程学***女生肌肉骨骼***预防行为*** 直击了解更多选题

已签订领域:人体工程,心理学题目:制定一个***人体工程学**,以识别、优先考虑***职业压力源的*** 直击了解更多选题

已签订领域:人体工程,心理学题目:多重工作**压力和工作***:***工效学方法的混合方法*** 直击了解更多选题

已签订领域:数学,经济题目:数学模型***结构调整和经济转型****研究 直击了解更多选题

已签订领域:数学,经济题目:***时间**数学模型在***媒体营销**中的应用*** 直击了解更多选题

已签订领域:数学,经济题目:***时间**模型在***物流运**能力***研究 直击了解更多选题

已签订领域:数学,经济题目:碳****经济的数学模型****研究 直击了解更多选题

已签订领域:农村经济题目:农****社区**发展***分**SCI四区 直击了解更多选题

已签订领域:农村经济题目:创业***对乡村****发展的****SCI四区 直击了解更多选题

已签订领域:农村经济题目:农村创业****的空间*****究SCI四区 直击了解更多选题

已签订领域:医学,电化学题目:纳米颗粒*****及其在癌症****和重金属*****检测中的应用SCI三区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****前列腺癌药物氟****检测方法的*****腺癌治疗SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:气海***********金纳米颗粒的新型****************粘土及其对胃癌********************抗癌SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于抗***********GCE纳米***********材料的高性能*******************早期癌症SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:用******电化学生物传感器*****癌症***************SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****石墨烯纳米****材料的生物传感******用于测定结肠*****生物*****SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:聚合***纳米复合电极*****疏辛酸电化学检测*********SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:利用****酸/**糖**石墨烯纳米复合修饰的电化学*****SCI二区 直击了解更多选题

已签订领域:环境能源,绿色投资题目:环境能源、绿色投资、城市化和环境类方向SCI三区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语教学**人工智能***习SCI 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐形式*学生***影响SCI三区 直击了解更多选题

已签订领域:经济,绿色投资题目:***能源效率***化之间的***SCI三区 直击了解更多选题

已签订领域:经济政策题目:***阐明**印度经济***的关系SCI三区 直击了解更多选题

已签订领域:经济,金融题目:***国家的能源***重***SCI 直击了解更多选题

已签订领域:经济,金融投资题目:***融新之间***直接投资***SCI三区 直击了解更多选题

已签订领域:经济,数学,统计学,管理学题目:非***想重限制下***袭评价***SSCI四区 直击了解更多选题

已签订领域:经济,数字,管理学题目:基干***生产系统***SSCI四区 直击了解更多选题

已签订领域:农业,土壤科学题目:不同***有机覆盖***养分循环SSCI 直击了解更多选题

已签订领域:电力与能源系统,管理题目:pv***氢定价的***随***型稀SSCI,SCI二区 直击了解更多选题

已签订领域:建筑规划,计算机题目:使用***因子分析法***可持续***SCI三区 直击了解更多选题

已签订领域:工程技术,纺织工程,材料科学题目:甘***淀粉酶的提取***退浆中的应用SCI四区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:饲料***镉毒性的交互***生长***病理学***SCI二区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:****鱼水源***起的生******SCI三区 直击了解更多选题

已签订领域:金融,环境经济题目:*****预算在能效、绿色***的作用SCI 直击了解更多选题

已签订领域:应用数学/计算物理题目:***非线性库***自相位调制***SCI三区 直击了解更多选题

已签订领域:计算机,医学检测题目:***COVID-19***力***算法***决策SCI三区 直击了解更多选题

已签订领域:计算机,物联网,智慧城市题目:基于***物联网****算法SCI三区 直击了解更多选题

  本文将不同属性与实体的关系模式概括为四种类型,通过模式类型决定相似度计算策略,再根据属性的格式决定基本的相似度计算函数。系统将多个属性的相似度组织成向量的形式表示,通过监督学习的方法形成判决器,最后在实体关系图上完成迭代划分。

  摘要:很多领域都面临实体识别问题,但现有解决框架缺乏通用性。提出了一种基于属性模式的领域无关的实体识别框架。属性的模式代表属性与实体的一种关系,将模式分为四种类型分别处理,针对类型特点提出了更为通用的相似度计算方法。系统根据模式类型决定相似度计算策略,使系统具有更强的扩展性。该框架可以有效综合利用各类属性的特点进行实体识别,结果优于一般的基于属性特征或基于实体关系的方法。

  关键词:实体识别,属性模式,扩展性,框架

  0引言

  实体识别就是判别来自一个数据源或多个数据源的描述是否指向同一个实体。此问题由来已久,现已提出很多方法。解决实体识别问题所利用的信息可分为两类,属性特征信息和关系信息。基于属性特征的方法最简单、使用得也最多,但却因属性信息有限,在某些情况下并不足以提供高置信度的判断结论。越来越多的方法开始利用属性的关系或规则进行实体识别,但利用这种关系的方式却各不相同,导致缺乏通用性。对每个实体识别问题都需要重新设计解决方案也必将是低效的,因而需要开展研究,予以改进。

  1相关研究

  文献[1,2]研究了相似函数选择和阈值确定问题。通过发现相似函数和阈值的冗余,去除不合适的相似函数和阈值设置。为了有效整合多种方法的优点,文献[3]提出了一种按有监督学习的结果聚类分配权重的方法,为权重分配提供了新的思路,但选择作为聚类的特征是经验性的,是否可以推广尚未确定。文献[4]设计了一个领域无关的实体识别系统,可以通过学习的方式对数据的格式进行转化,以满足识别系统进行比较的需要。文献[5]研究了利用合作者集合的相关性的方法,实验证明其优于一般的非整体分析的方法。

  2基于属性模式的实体识别框架介绍

  系统结构如图1所示,主要分为以下几个部分:

  (1)相似度度量策略形成模块。该模块通过属性的模式和数据格式自动地选择相似度函数,形成相似度度量策略。

  (2)相似度计算模块。该模块按照选择的相似度函数计算实体对的相似度。

  (3)判决器模块。该模块在训练阶段统计实体对的相似度分布情况,在实体划分阶段辅助判断。

  (4)实体关系图。实体划分阶段在实体关系图上迭代进行,每次完成实体合并以后,重新计算经过调整的实体对的相似度,直到所有相似边都处理完毕,实体划分结束。

  3系统各部分的实现

  3.1相似度计算策略的形成

  为了实现系统的通用性,相似度计算策略必须领域无关地进行。为此分析了实体与属性间的关系,按其特点进行了分类。利用各属性的模式可以确定相似度计算的方法。

  3.3实体划分算法

  实体划分在实体关系图上进行。实体关系图的顶点表示记录,边表示实体对间的相似度,通过边的操作进行实体划分。

  关系图的顶点分为两类,一类是原始顶点,其中只包含一条记录;另一类是划分过程中新形成的点,称为超点,超点带有表示实体的标签,且包含此实体的记录的集合。边e代表的是实体对间存在相似,边的权值为相似向量。原始关系图中仅含原始顶点,当所有实体对的相似向量计算完毕,并建立起原始关系图后,就可开始进行实体划分了。

  实体划分算法主要过程为:从未标记边中选择相似度最大的边,查询判决器,若大于判断阈值,则判为同一实体,合并相关顶点,即CLUSTER操作,有关边的相似度则需要进行重新计算;否则即对边做暂时标记。继续在剩下未标记边中寻找相似度值最大的边,重复此过程。当没有未标记边剩余时,再对标记边进行拆分操作SPLIT,直到无边剩余。

  CLUSTER操作主要是对顶点进行合并或创建。当边的对象(e.O)与端点标签相同时进行合并,否则就需要新建顶点。具体操作如表2所示。其中,边所连接的记录为x和y,记录所在的顶点分别为u,v。顶点调整过程中,特别当顶点包含的记录增多后,顶点的属性集合增大,此属性的相关度也可能增大,此时需要重新计算有关边的相似度。

  5结束语

  本文提出了一种基于模式的实体识别方法,针对模式特点的相似度计算方法更具有通用性。以向量表示属性的相似度,通过监督学习形成判决器。实体划分阶段每次选择最相似的实体对,通过查询判断单元进行判断,更新相关实体对的相似向量,并迭代进行实体划分。实验结果表明能自动有效地进行实体划分。现存的问题包括平均划分相似空间的方法不够精细,用户要求的准确率较高时,召回率较低。下一步的研究重点包括判断器的划分方式以及当用户输入较高判断阈值情况下如何提高系统的召回率。

  参考文献:

  [1]MENESTRINAD,WHANGSE,GARCIA-MOLINAH.Evaluationofentityresolutionapproachesonreal-worldmatchproblems[C]//VLDB,2010:208-219.

  [2]WANGJiannan,LIGuoliang,YUXu,etal.Entitymatching:howsimilarissimilar[C]//VLDB,2011:622-633.

  [3]CHENZ,KALASHNIKOVDV,MEHROTRAS.Exploitingcontextanalysisforcombiningmultipleentityresolutionsystems[C]//SIGMOD,2009:207-218.

  [4]TEJADAS,KNOBLOCKCA,MINTONS.Learningdomain-independentstringtransformationweightsforhighaccuracyobjectidentification[C]//Proc.EighthACMSIGKDDInt’lConf.KnowledgeDiscoveryandDataMining(KDD’02),2002.



  • 教育部:鼓励教师评高级职称可投稿的核心期刊推荐

    2026-03-11
    2026年中小学、高职和大学教师评职称竞争越来越大,为了能够提升教师们的学术价值、影响力和认可度,教育部,鼓励教师评高级职称。那么, 2026年教师评高级职称发表论文的要求 是什么?以及 可投稿的核心期刊有哪些 ?以下为大家做出了详细介绍: 一、清楚:教师评高级
  • 危重病医学sci《JOURNALOFCRITICALCARE》中科院3区,0版面费

    2026-03-11
    《 JOURNAL OF CRITICAL CARE 》中科院3区,影响因子2.9,0版面费,对于预算紧缺,想要快速发表sci期刊论文的你,无论是毕业还是职称晋升,这本期刊都比较合适,不仅审稿速度快,且无预警。以下是该sci期刊信息详情: 1、期刊信息详情 期刊ISSN:0883-9441 E-ISSN:155
  • 食品科学与技术sci1-2区top刊精准推荐(附热门选题)

    2026-03-11
    民以食为天,作为每天都能吃上美食的你,特别是食品科学与技术研究人员,想要在学术方面提升权威性、影响力和认可度,发表一篇高质量的sci1-2区top期刊优势多多,对于毕业、职称晋升、留学和就业都具有较高的评价。以下是 食品科学与技术sci1-2区top刊精准推荐(附热门
  • 工程:制造SCI《Journal of Manufacturing Processes》1区Top,IF 6.8

    2026-03-11
    恭喜经月期刊咨询网辅助成功发表在SCI期刊: Journal of Manufacturing Processes ,JCR分区:工程制造Q1,2025中科院期刊分区:工程技术1区Top,IF6.8,对于毕业或职称晋升是一本不错的选择平台。下面一起看看该sci期刊的信息详情: 一、论文投稿sci期刊时间阶段分享
  • 论文被3区sci拒稿后,成功发表到1区TOP刊

    2026-03-11
    一篇211高校的硕士研究生,投稿4次,均被2、3区sci期刊拒稿;但他大胆改投1区TOP,最后却成功发表。这是怎么做到的呢?不敢想象,下面一起看看他是怎么做的。 被多次拒稿,索性摆烂,不如大胆冲一冲,直接选择审稿周期短的一区top刊,即使被拒稿,也不会耽误太长时间。
  • 注意!3月1日起,中国科学院:将停止支付30种国际期刊高价发表费

    2026-02-26
    中国科学院计划从3月1日起停止使用学术经费和中央财政拨款支付约30种国际高收费开放获取(OA)期刊的论文发表费用。这些期刊的单篇发表费用均超过5000美元,受影响期刊包括《自然-通讯》《细胞报告》《科学进展》等知名刊物。 各学科领域容易投稿、高权威和含金量的sci
  • 选刊避坑指南!SCIE、SSCI期刊目录变更信息(2025年11月)

    2026-01-17
    2025年11月17日,科睿唯安更新了Web of Science核心期刊目录。本次更新的SCIE期刊目录共包含9445本期刊,SSCI期刊目录共包含3539本期刊。与上期相比共有4本期刊发生变更: Web of Science Core Collection每月更新一次,更新的内容包括Accepted(收录)、Partially Ind
  • 恭喜!工信部:已有4种英文期刊被SCIE收录

    2025-12-30
    据工信微报消息,近日,由北京理工大学主办的期刊《空间科学与技术(英文)》(Space:Science Technology)和《新能源与智能载运(英文)》(Green Energy and Intelligent Transportation),正式被科睿唯安(Clarivate)旗下的科学引文索引SCI的扩展版SCIE数据库收录
  • 查看!2025年“中国最具国际影响力学术期刊”榜单发布

    2025-12-11
    《中国学术期刊国际引证年报》(2025版)统计源期刊共计27117种,涵盖WoS、Scopus、EI、Medline 4个国际索引数据库大部分期刊。该报告统计了7240种中国学术期刊的国际被引。数据显示,2024年中国学术期刊国际他引总被引频次为300.9万次,境外施引作者数为511.5万人次。
  • 快速查看!2025年度首都科技期刊卓越行动计划中英文单刊拟入选名单的公示

    2025-12-10
    根据《关于开展2025年首都科技期刊卓越行动计划的通知》及《北京市科协2025年度首都科技期刊卓越行动计划实施方案》的有关要求,经公开申报、形式审查、定量计分、专家评审,现将2025年度首都科技期刊卓越行动计划中英文单刊拟入选名单予以公示。 首都科技期刊卓越行动
回到顶部