goback
月期刊咨询网
当前位置:首页>>计算机网络论文>>正文

计算机网络技术期刊论文范文参考


所属栏目:计算机网络论文
发布时间:2013-11-08 15:57:10  更新时间:2013-11-08 15:55:07

已签订领域:化学工程/制药,医学题目:**作为抗癌剂***催化剂**取代苯丙***SCI四区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:用**电***生物传感器**癌症**SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:**氧化石墨烯纳米***材料的生物传感器***结肠癌生物**癌胚****SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:聚合物纳米***a-硫辛酸***在神经炎症***应用***临床分析SCI二区 直击了解更多选题

已签订领域:计算机视觉/遥感/智能驾驶/汽车题目:**深度学习***高分辨率遥感***车辆检***SCI三区 直击了解更多选题

已签订领域:企业管理题目:社会交流***领导***倾向***方向SSCI,SCI三区,二区 直击了解更多选题

已签订领域:企业管理题目:**中小企业社交媒体****可持续绩效***因素探析SSCI,SCI三区,二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:利用硫氨酸***石墨烯纳米***电化学***传感器实现癌胚抗原***SCI二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:基于抗***纳米复合***高性能***早起癌症诊断***SCI二区 直击了解更多选题

已签订领域:经济,能源题目:***政治冲突****绿色金融、金融**、气***化***SCI四区 直击了解更多选题

已签订领域:经济,能源题目:冲***中能源不安全对***和环境***SCI四区 直击了解更多选题

已签订领域:教育题目:大学生***社交媒体***成绩影响***SSCI三区 直击了解更多选题

已签订领域:教育题目:巴基斯坦***学习实施的***的**SSCI二区 直击了解更多选题

已签订领域:教育题目:大学生对****下网络教学**思***SSCI二区 直击了解更多选题

已签订领域:教育题目:**教师和学生对影响***医疗**效果的****看法SSCI三区 直击了解更多选题

已签订领域:计量经济学题目:**货币、黄金、**和美国***的波动***相互依赖性:**数据的分析SSCI一区 直击了解更多选题

已签订领域:计量经济学题目:东南亚***内**趋同***中等收入**:新**的***SSCI二区 直击了解更多选题

已签订领域:建筑,历史题目:历史景点在***旅游发***中的***影响**(**研究:**历史***)SSCI,SCI一区 直击了解更多选题

已签订领域:领导力,管理题目:量化**领导对角色绩效***响:**冲突与工作自主性***作用SCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:数字***环境对学生学习成绩***:游戏**和***现实在教育***作用SSCI四区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***续决策之间的***:创新***识的**作用SSCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:课程**对大学生***发展的影响:学习习惯和***的***作用SSCI一区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***与可持续决策**:高等***学生认知***作用SSCI二区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语****学**与人工智能****学习SCI三区 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐**对学生成绩***的影响SCI三区 直击了解更多选题

已签订领域:人体工程,心理学题目:基于预先处理模型***模式人体工程学***女生肌肉骨骼***预防行为*** 直击了解更多选题

已签订领域:人体工程,心理学题目:制定一个***人体工程学**,以识别、优先考虑***职业压力源的*** 直击了解更多选题

已签订领域:人体工程,心理学题目:多重工作**压力和工作***:***工效学方法的混合方法*** 直击了解更多选题

已签订领域:数学,经济题目:数学模型***结构调整和经济转型****研究 直击了解更多选题

已签订领域:数学,经济题目:***时间**数学模型在***媒体营销**中的应用*** 直击了解更多选题

已签订领域:数学,经济题目:***时间**模型在***物流运**能力***研究 直击了解更多选题

已签订领域:数学,经济题目:碳****经济的数学模型****研究 直击了解更多选题

已签订领域:农村经济题目:农****社区**发展***分**SCI四区 直击了解更多选题

已签订领域:农村经济题目:创业***对乡村****发展的****SCI四区 直击了解更多选题

已签订领域:农村经济题目:农村创业****的空间*****究SCI四区 直击了解更多选题

已签订领域:医学,电化学题目:纳米颗粒*****及其在癌症****和重金属*****检测中的应用SCI三区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****前列腺癌药物氟****检测方法的*****腺癌治疗SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:气海***********金纳米颗粒的新型****************粘土及其对胃癌********************抗癌SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于抗***********GCE纳米***********材料的高性能*******************早期癌症SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:用******电化学生物传感器*****癌症***************SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****石墨烯纳米****材料的生物传感******用于测定结肠*****生物*****SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:聚合***纳米复合电极*****疏辛酸电化学检测*********SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:利用****酸/**糖**石墨烯纳米复合修饰的电化学*****SCI二区 直击了解更多选题

已签订领域:环境能源,绿色投资题目:环境能源、绿色投资、城市化和环境类方向SCI三区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语教学**人工智能***习SCI 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐形式*学生***影响SCI三区 直击了解更多选题

已签订领域:经济,绿色投资题目:***能源效率***化之间的***SCI三区 直击了解更多选题

已签订领域:经济政策题目:***阐明**印度经济***的关系SCI三区 直击了解更多选题

已签订领域:经济,金融题目:***国家的能源***重***SCI 直击了解更多选题

已签订领域:经济,金融投资题目:***融新之间***直接投资***SCI三区 直击了解更多选题

已签订领域:经济,数学,统计学,管理学题目:非***想重限制下***袭评价***SSCI四区 直击了解更多选题

已签订领域:经济,数字,管理学题目:基干***生产系统***SSCI四区 直击了解更多选题

已签订领域:农业,土壤科学题目:不同***有机覆盖***养分循环SSCI 直击了解更多选题

已签订领域:电力与能源系统,管理题目:pv***氢定价的***随***型稀SSCI,SCI二区 直击了解更多选题

已签订领域:建筑规划,计算机题目:使用***因子分析法***可持续***SCI三区 直击了解更多选题

已签订领域:工程技术,纺织工程,材料科学题目:甘***淀粉酶的提取***退浆中的应用SCI四区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:饲料***镉毒性的交互***生长***病理学***SCI二区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:****鱼水源***起的生******SCI三区 直击了解更多选题

已签订领域:金融,环境经济题目:*****预算在能效、绿色***的作用SCI 直击了解更多选题

已签订领域:应用数学/计算物理题目:***非线性库***自相位调制***SCI三区 直击了解更多选题

已签订领域:计算机,医学检测题目:***COVID-19***力***算法***决策SCI三区 直击了解更多选题

已签订领域:计算机,物联网,智慧城市题目:基于***物联网****算法SCI三区 直击了解更多选题

  摘要:为了使用户快速地从网页中找到所需要的内容,在设计搜索引擎时,需要更好地提高搜索引擎效率和精度,该文阐述了六种提高搜索引擎效率和精度的技术。

  关键词:搜索引擎,聚类,相关度

  互联网自诞生以来不断成长,其内容不断丰富,整个网络逐渐堆积成一个前所未有的超大型信息库。Internet作为一个信息平台在人们的日常生活和工作中发挥着越来越重要的作用,人们越来越多地通过Internet获取信息。然而伴随互联网的飞速发展,普通网络用户想找到所需的资料简直如同大海捞针,以至于迷失在信息的海洋中不知所措。搜索引擎的出现正好缓解了人们面对互联网信息爆炸带来的压力,但是尽管如此,搜索引擎搜索得到的结果中仍然包含了与用户查询请求不相关的文档,用户必须逐个地浏览以找到相关文档,花费了大量的精力。当返回的结果数目众多时,这个问题更为突出。因此如何更好地提高搜索引擎效率和精度,成为搜索引擎重点需要解决的问题。目前提高搜索引擎效率和精度的方法主要有如下六个关键技术。

  1基于超链的相关度排序

  排序搜索引擎的检索结果往往过于庞大,用户一般只会浏览前面的一部分结果。通过对检索结果进行相关度排序,搜索引擎试图使相关的文档尽可能地出现在结果的前面部分,以改进检索结果的输出。虽然各个搜索引擎中相关度排序的具体实现各不相同,但是基本上都采用了基于Web文档内容的方法,即考虑用户所查询的词条在文档中的出现情况,包括:词条频率、逆文档频率、词条位置等因素。这种方法有很大的局限性。一方面,相关度高的页面不一定是用户普遍欢迎的页面;另一方面,有些Web页面的作者利用上述因素来欺骗搜索引擎(spamming),以提高其页面的排序。

  事实上,Web中还蕴含了丰富的结构信息。页面之间的超链反映了页面间的引用关系,一个页面被其它站点引用的次数基本上反映了该页面的受欢迎程度(重要性)。超链中的标记文本(anchor)对链宿页面也起到了概括作用,这种概括在一定程度上比链宿页面作者所作的概括(页面的标题、关键字、摘要)要更为客观、准确。因此,近年来出现了一些基于超链的相关度排序方法,作为基于内容方法的补充,例如,Stanford大学研究的PageRank算法等。这类方法通过为Web页面构造引用图,并综合考虑页面的被引用次数以及链源页面的重要性来判断链宿页面的重要性。一些搜索引擎已经开始使用基于超链的相关度排序方法。例如,以PageRank为核心技术的搜索引擎Google能够查询与用户请求相关的“权威”页面[1]。此外,Google通过分析超链中包含的文本,可以对链宿页面进行非全文索引,而不需要下载和分析实际的页面。目前,Google已经发展成为一个主要的搜索引擎,实际下载并索引了近100000000的Web页面。但是通过超链分析,其覆盖度达到了300000000,超过了其它任何搜索引擎。

  2检索结果的联机聚类

  尽管搜索引擎采用了各种方法来提高检索结果的精度,但是结果中仍然包含了与用户查询请求不相关的文档,其比例高达75%以上。此外,搜索引擎返回给用户的通常是一个线性的文档列表,虽然经过了相关度排序,但是相关文档和不相关文档仍然混杂于其中。用户必须逐个地浏览以找到相关文档,花费了大量的精力。当返回的结果数目众多时,这个问题更为突出。

  为了方便用户的浏览,一些研究人员开始将聚类技术用于Web信息检索结果的可视化输出。聚类是指将文档集合分成若干个簇,要求同一簇内文档内容的相似度尽可能地大,而不同簇间的相似度尽可能地小。Hearst等人的研究已经证明了“聚类假设”,即与用户查询相关的文档通常会聚类得比较靠近,而远离与用户查询不相关的文档。因此,我们可以利用聚类技术将搜索引擎的检索结果集合S划分为若干个簇(S1,…,Si,…,Sm),并以簇Si的质心averaged∈Si(d)作为簇Si的描述。这样,用户只需要考虑那些相关的簇,大大缩小了所需要浏览的结果数量。当一次聚类生成的簇Si中仍然包含大量文档时,可以对该簇中的文档再次聚类得到若干个子簇(Si,1,…,Si,j,…,Si,n),直到用户满意为止[2]。。Etzioni等人的实验结果表明,使用一些改进算法来对检索结果进行联机聚类不但是可行的,而且十分有效。

  3基于概念的检索

  大多数搜索引擎提供的检索服务是一种关键字检索(KeywordSearch),即检索出那些显式地包含用户指定词条的文档。由于自然语言中广泛存在同义和多义现象,关键字检索显然是不够的。一些搜索引擎,例如Magellan,开始在关键字检索的基础上引入基于概念的检索(ConceptSearch)。该方法利用了词条在概念上的相关性,因此可以检索出那些并不显式地包含用户指定的词条,但是却包含其同义词或者下位词的文档。例如,用户向Magellan查询“robot”时,Magellan除了返回包含“robot”的结果,还会找到提及“crawler”,“spider”,“wander”等词条的结果。这样,既方便了用户请求的输入,也提高了信息检索的召回率。

  搜索引擎在实现基于概念的检索时,一般通过对用户的查询进行概念/词条扩展,然后转化为关键字检索。概念/词条关系的获得可以有以下两种方法。

  1)手工建立词典来存储概念层次及词条之间的交叉联系,该工作通常由领域专家来完成。

  2)使用语法分析、统计等技术从文档集合中自动学习。

  4相关度反馈

  在很多情况下,用户难以提出查询,其初始的查询请求q通常是不精确、不完全的。与基于概念的检索类似,相关度反馈技术也可以帮助用户形成查询请求。但是,基于概念检索的目的是通过扩展查询请求来提高系统的召回率,而相关度反馈技术则是通过对查询请求不断地进行修正以提高系统的精确度。。

  具有相关度反馈功能的系统中,系统按照下述过程对用户的查询请求进行逐步求精。

  1)索引器给出查询q的检索结果集合S。

  2)用户对S中文档的相关度进行评估,并反馈给系统。所有被用户标记为“相关”的结果组成了正反馈集合S+,标记为“不相关”的结果组成了负反馈集合S-。

  3)系统根据用户的反馈对查询q进行修正。例如,在矢量空间索引模型中,可以将正反馈集合中的文档矢量加到查询矢量上,同时减去负反馈集合中的最不相关的若干文档矢量,即V(q)←V(q)+∑d∈S+V(d)-∑d∈argmax(S-)V(d)。

  4)重复步骤1),2),3),直到用户得到满意的结果为止[3]。

  一些研究和实验结果表明,利用相关度反馈可以较好地改进检索效果。但是,目前很少有搜索引擎支持该功能。其原因可能是因为相关度反馈需要用户的参与,而普通用户在使用搜索引擎时不太愿意花时间利用这些附加功能。

  5分词技术

  网上的中文信息具有分词复杂、多内码转换等特点。因此,中文智能搜索有其独有的特点。

  对中文信息的访问,不可避免的会遇到分词,这也是中文搜索引擎要解决的主要问题。现有的汉语分词算法有很多,如基于词库的最大匹配法、逆向最大匹配法、最佳匹配法、高频优先分词法;基于语法和规则的分词法;基于频度和统计的分词法;基于神经网络的分词法和专家系统分词法等[4]。这些算法适用于不同要求的场合但又存在各自的缺陷,在具体应用时一般使用几种算法相结合的方式来弥补单纯使用一种分词法所带来的不足。分词技术中的基于词库的算法日前使用较广,也较为成熟。这类算法分词的正确性很大程度上取决于所建的词库。一个词库应具备完备性和完全性两方面。词库的完备性,简单来说就是对任意一个字串,总能按词库找到对它进行切分的方法。词库的完全性,意味着词库应包含所有的词。通常先构造一个最小完备词库,然后在此基础上进行扩展,建立一个完全词库。

  6数据库中增量式信息更新方法

  增量式信息更新方法的基本思路是:在WWW中包含大量的文档资源,这些资源的变化周期是不一致的:有的变化无常,有的十分稳定。因此应该以文档的变化周期作为进行有效性验证的依据,在每一次索引信息库的更新过程中,只对那些最可能发生变化的(部分)文档进行验证。

  一个文档的变化周期就是它相邻的两次变化之间的时间间隔。

  值得注意的是,一个文档的变化周期可能是不固定的。在某个时期内,它可能变化得比较频繁,而在另一个时期内,它则可能比较稳定。一般地说,无法准确地计算一个文档变化周期,只能根据文档在一个时期内的变化情况来估算它的变化周期。下面给出一个启发式规则,作为估算文档变化周期的一个依据。

  如果在一个时间间隔内一个文档的内容没有发生变化,那么可以认为它处在一个稳定期,在下一个相同的时间间隔内它也很可能不会发生变化。反之,如果在一个时间间隔内一个文档的内容发生了变化,那么在这个时间间隔内它就很可能发生了多次变化。

  从实用的角度出发,通常以索引信息系统的信息更新周期作为度量文档变化周期的时间单位,也就是说,一个文档变化周期的取值只能是系统信息更新周期的倍数。给出如下的增量式信息更新算法:

  /*假设当前正在进行的是第k(k≥1)次信息更新过程。*/

  Begin

  While(索引信息库中还有文档信息的有效性没有验证时){任取一个未验证的文档作为当前文档;

  If(当前文档的变化周期f是k的因子)Then

  {验证当前文档的有效性;

  If(当前文档已不能被访问)Then

  从索引信息库中删除对应的记录

  If(当前文档已经发生了变化)Then

  {把当前文档URL加入到目标列表;

  把当前文档的变化周期修改为Max(1,f/2);

  }

  Else

  把当前文档的变化周期修改为2f;

  }

  以目标列表中的URL作为浏览起点,启动机器人开始新一轮信息收集工作;

  End[5]

  当一个文档第一次进入系统时,它的变化周期被假定为1。也就是说,假定它会在系统更新周期内发生变化。随着信息更新过程的不断进行,将根据文档的实际变化情况,不断地调整它们的变化周期。如果一个文档的索引信息在一次信息更新过程需要予以更新,也就是说,文档的内容发生了变化,我们认为它很可能会在近期内再发生变化,因此,把它的变化周期缩短为原来的一半。如果在预计的变化周期内文档没有改变,那么就认为它在近期是比较稳定的,因此把它的变化周期扩展为原来的两倍。

  增量式信息更新方法可以极大地减轻搜索引擎进行索引信息库维护的负担。由于我们以系统信息更新周期作为度量文档变化周期的基本时间单位,而且文档变化周期只能是系统信息更新周期的2的幂次,因此可能会影响少量文档索引信息的时效性。但是,考虑到WWW庞大的规模,从整体上看,增量式信息更新方法是一个能够提高搜索引擎工作效率的有效手段。

  总的说来,在搜索引擎的发展过程中,虽然出现了上述众多的技术来提高引擎工作效率,但不管是那种技术,短期内,要完全使搜索引擎在实现技术上都超过人脑仍然是难以达到的。因此,人脑和电脑的分工和配合依然会是产生一个高质量搜索引擎的最好保证,这也是今后搜索引擎的发展所必须要注意的重要事情。

  参考文献:

  [1]凤元杰,刘正春,王坚毅.搜索引擎主要性能评价指标体系研究[J].情报学报,2004,23(1).

  [2]梁斌.走进搜索引擎[M].北京:电子工业出版社,2007.10

  [3]徐宝文.搜索引擎与信息获取技术[M].北京:清华大学出版社,2003.

  [4]邱哲,符滔滔.开发自己的搜索引擎[M].北京:人民邮电出版社,2007.

  [5]CayS.HorstmannJAVA2核心技术卷II:高级特性[M].7版.北京:机械工业出版社,2006.



  • 职称晋升申请书范本2篇

    2025-02-22
    撰写职称晋升申请书时,您需要清晰、专业地展示您的工作成就、专业能力以及对职位提升的渴望。以下是 职称晋升申请书范本2篇 ,您可以根据实际情况进行调整: 1、医、护人员职称晋升申请书范文1篇 尊敬的领导: 本人于xxxx年毕业于xxxx护理专业,毕业后在医院中心监护
  • 高分子化学sci期刊一览 Q1-Q4都在这里

    2025-02-22
    在化学装爷领域中,高分子化学sci期刊众多,按照JCR分区,从Q1到Q4区都有涵盖,作者可根据单位和论文质量选择合适的期刊投稿。以下是 高分子化学sci期刊一览 Q1-Q4都在这里 ,供大家参考: 1、 CHINESE JOURNAL OF POLYMER SCIENCE JCR:Q2区 IF:4.1 致力于发表高分子
  • 2025年RCCSE期刊目录更新到第几版?第七版

    2025-02-22
    截至2025年2月22日,RCCSE期刊目录已经更新到了第七版 。第七版RCCSE中国学术期刊目录是在2024年12月6日至8日召开的第七届中国期刊质量与发展大会上正式发布的,具体详情如下: 1、RCCSE期刊是什么意思 RCCSE期刊是指被武汉大学中国科学评价研究中心(Research Center
  • 论文二审还会给原来的审稿人吗?接受率多少

    2025-02-22
    二审是论文发表期刊过程中最为严格且重要的环节之一,审稿周期较长,建议作者耐心等待。对于, 论文二审还会给原来的审稿人吗 ? 并没有一个统一的答案,可能是原来的审稿人,也可能是新的审稿人,具体取决于期刊的具体政策和审稿人的可用性。 关于论文二审是否还会送
  • 速看!审稿出版最快的教育学SSCI期刊及选题推荐

    2025-02-21
    在教育学领域,被ssci收录的期刊众多,想要选择审稿出版快的期刊,对于新手作者来说确实很难,而且出版周期长短与论文质量、期刊的影响力等因素有直接的关系。今天在这里为大家汇总整理了部分 审稿出版最快的教育学SSCI期刊及选题 ,供大家参考: 一、审稿出版最快的教
回到顶部