皖西学院学报入选论文高等学校学术表现评价应用
所属栏目:社会学论文
发布时间:2013-12-07 15:12:41 更新时间:2013-12-07 15:27:40
学术表现评价在高等学校工作中占有重要地位。高等学校科研及学术水平的高低对人才培养、技术创新、国民经济发展都会产生深远的影响,因此,构建和谐、高效、积极的学术表现评价机制是正确引导高校学术方向,促进高等学校学术健康发展的保障。
摘要:学术表现评价是高等学校做好人才引进培养、个人/团体绩效评估、专业技术职务晋升等工作的前提和基础,运用何种科学的方法进行学术评价是高等学校所面临的重要课题。运用h指数和g指数相结合的信息计量学评价方法,运用SPSS软件进行实证研究。研究表明,h指数在评价学者学术影响力时较好地综合了学者科学产出的质量和数量,而g指数则在h指数的固有优势的基础上进一步优化了评价指标,以更客观方法进行评价。
关键词:h指数,g指数,学术评价
引言
近年来,我国各高等学校根据自身的学科特点和学校发展定位制定了不同的学术评价标准和评价指标体系。在高校学术评价体系中,评价研究人员所发表论文质量时,往往以该文是否发表在本领域权威或者核心期刊上来判定;而管理者为简化对研究人员学术水平、声望及其论文学术价值的判断,通常使用一定时期内论文发表的数量、论文总被引频次、篇均被引次数等。但这种传统引文评论方法对专家学者学术影响力的评价效果不能让人满意。论文数是指个人或单位在一定时间内发表的论文总数,但是论文数量无法说明论文的重要性和影响力,而且数千种学术期刊发表的论文水平良莠不齐,片面强调论文数量存在一定的弊端。平均引用次数,即总被引频次除以总论文数的结果。该指标对发表论文少且每篇论文引证数高的人很有利,但不利于论文多产者。针对这些评价指标存在的不足,物理学家Hirsch(2005)提出h指数作为评价研究人员科学产出的标准,比利时著名科学计量学家Egghe(2006)提出了g指数。h指数和g指数提出后,受国内外学者的广受关注,已经成为信息计量学研究的前沿领域。
一、h指数和g指数概述
(一)h指数
美国物理学家JEHirsch(2005)提出的h指数在学界产生较大影响。他将h指数定义为:当且仅当一个科学家有N篇引文数至少为h的论文,同时其余论文的引文数都小于h时,该科学家h指数的值为h[1]。随后Rousseau在Hirsch基础上提出了h指数更精确的定义:将科学家S发表的论文按照引文数从高到低的顺序排列,相同引文数的论文具有不同的序列号(对此没有严格限制Rousseau建议按论文发表时间倒序排列),当且仅当前h篇论文每篇论文的引文数至少为h,同时第h+1篇论文的引文数小于h+1时则科学家S的h指数值为h[2]。
h指数的优点是明显的。首先,和传统的引文分析法相比较,h指数是一个非常简单并且易于理解的复合指标,h指数兼顾个人科学产出的质量和数量,得出的影响力评价更为合理;其次h指数是动态的,不是静止不变的,随着时间推移,科研人员会产出更多的成果,并且科研人员以往的成果在未来的引用次数会只增不减,这对科研人员是一个极好的激励[3]。目前,h指数已被越来越多的科研人员所接受,正如Hirsch所说,“你无法伪造它,因为它依赖的运作机制需要有个时间跨度。”研究过科学引文统计学的波斯顿大学的物理学家SidneyRedner也表示同意:“想要操纵整件事非常困难”[4]。但是h指数对于那些刚开始从事科学研究的人员和那些论文数量少而被引频次高的学者而言是不利的,因为他们的论文产出和引文率相对较低。
(二)g指数
g指数是h指数的衍生指数,主要是为弥补h指数不能很好反映高被引论文的缺陷而提出的。Egghe(2006)提出了g指数:论文按被引次数排序后相对排前的累积被引至少g2次的最大论文序次g,亦即第(g+1)序次论文对应的累积引文数将小于(g+1)2。从定义可以看出g≥h,而按被引量排序靠前的文章的被引次数越大,g指数越大。
Egghe在分析h指数评价效果时,提出了一种基于学者以往贡献的g指数——将论文按被引次数由高自低排序,将序号平方,被引次数按序号层层累加,当序号平方等于累计被引次数时,该序号则为g指数。如序号平方不是恰好等于而是小于对应的累计被引次数,则最接近累计被引次数的序号即为g指数。和h值一样,g值越大说明该学者的学术影响力越大、学术成就越高,通常作为h指数的补充或提高[5]。Egghe认为h指数的优点是对低被引频次文献不敏感,但是它应该对所有高被引频次文献敏感。g指数很好地反映出了那些高被引文献,体现了高被引文献被引次数的增长对期刊学术影响力的影响。
二、h指数和g指数的计算与分析
本文选取某“211”高校教授作为实证研究对象,由于篇幅所限,现随机选取某一级学科十位教授进行比较分析,利用CNKI数据库的机构检索功能(AffiliationSearch),统计在1998—2012年期间这10位教授发表所有论文的被引总次数和被引篇数,并计算得出每位学者的篇均被引次数、h指数和g指数(如表1所示)。
表1某一级学科1998—2012年度教授论文发表情况
结合数据统计过程中的一些发现对表1进行分析,可以得出以下论点。
1.在考察某高校某学科领域内专家教授的学术影响力时,被引总次数这个指标比较有利于发文较多的作者,而篇均被引次数则有利于发文较少的作者。这两个指标均无法十分有效地衡量专家教授在其学科领域内的学术影响力,而h指数和g指数则较好地解决了这个问题,平衡发文的质量和数量,评价效果较好。
2.在对这10位教授进行学术表现评价分析时,发现教授论文的g指数都明显高于h指数,而且存在h指数相对较低教授的g指数却很高的情况,原因在于学术领域中有刚开始从事科学研究的人员和那些论文数量少却有比较经典的文章使得被引频次高的学者,而在h指数的计算中,这些著作的影响力并没有得到充分展示,而g指数由于其和h指数不同的计算机制,在这方面表现较好,恰好弥补这这一缺陷。如表1中的庞教授虽然h指数不是最高,但g指数非常突出,体现了其在本学科领域中的影响力。3.在对教授论文影响力进行评价时,是否排除自引一直是个具有争议性的话题,所以很多时候评价作者影响力的论文不得不同时给出排除自引和不排除自引得到的两种结果。在对h指数和g指数进行计算的过程中发现,这两个评价指数对于自引具有较好的鉴别作用,虽然个别作者的自引数量较多,但对h指数和g指数影响并不大。
三、相关性分析
Pearson相关系数用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系[6]。相关系数的绝对值越大,相关性越强,相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。通常情况下根据以下取值范围判断变量的相关强度:相关系数在0.8—1.0之间极强相关;在0.6—0.8之间强相关;在0.4—0.6之间中等程度相关;在0.2—0.4之间弱相关;在0.0—0.2之间极弱相关或无相关。
(一)h指数和总被引次数的相关性分析
根据表1,可以得到h指数和被引总次数的关系(如图1所示)。
图1h指数和被引总次数关系
利用SPSS软件进行相关性分析,经检验h指数和总被引次数均符合正态分布,因此可以选择Pearson相关来衡量相关性的强弱。经计算得到h指数和总被引次数相关系数大小及显著性检验结果(如表2所示)。
表2h指数和被引总次数相关性分析
相关分析是一种基于假设检验的统计分析方法,而显著性水平(Significantlevel)反映了拒绝某一原假设时所犯错误的可能性。在本检验中,显著性水平设为0.01,也即在原假设事实上正确的情况下,研究者接受这一假设的可能性为99%。本文的原假设是“相关系数为零”(即h指数和被引总次数之间不存在显著的相关关系),经计算,统计量的相伴概率(即某特定取值及更极端可能值出现的准确概率,用p表示),在表3中即显著性(双侧)为0.001,低于0.01。因此,可以认为“相关系数为零”的可能性很低,h指数和被引总次数之间存在显著相关关系;相关系数r=0.916,说明总被引频次和h指数之间存在极强的相关性。
(二)g指数和总被引次数的相关性分析
根据表1,可以得到g指数和被引总次数的关系(如图2所示)。
图2g指数和被引总次数关系图
利用SPSS软件进行相关性分析,得到g指数和总被引次数相关系数大小及显著性检验结果(如表3所示)。
表3g指数和被引总次数相关性分析
**.在.01水平(双侧)上显著相关。
由表3可知,g指数和被引总次数之间存在显著相关关系,相关系数r=0.879,说明总被引频次和h指数之间存在极强的相关性。
(三)h指数和g指数的相关性分析
根据表1,利用SPSS统计软件进行相关性分析,得到h指数和g指数相关系数大小及显著性检验结果表(如表4所示)。
表4h指数和g指数相关性分析
**.在.01水平(双侧)上显著相关。
由表4可知,h指数和g指数之间存在显著相关关系,相关系数r=0.947,说明总被引频次和h指数之间存在极强的相关性。
四、结论
通过以上的相关性分析得出,h指数、g指数与传统引文评价的关系十分密切,相关系数也很大,h指数在评价高校学者某学科领域内的影响力时较好地综合了学者科学产出的质量和数量,而g指数则在h指数固有优势的基础上进一步优化了高校学术表现评价指标,使其更趋于科学化、合理化。学术表现评价是考核科研工作者学术水平的一个主要指标,也是衡量高校办学水平的重要指标之一。因此,采用科学的学术评价指标对高校学者进行学术评价,有着十分重要的现实意义[7]。
高等学校学术表现评价具有重要的实际应用价值,评价范围并不仅仅局限于本文,可以将被评价学科着眼于全国乃至世界同类一级学科进行横向比较,检验其学术成就,但在实际评价操作过程中应该注意以下几点问题:第一,数据更新问题。必须定期相应地更新学科基准线,同时,不要将采集面板数据时间拉得过长,以免导致整个基准线失衡,使评价结果失真。第二,数据甄别问题。评价过程数据量较大,数据处理要保证准确性。例如,某个学者的个人经历不同,不同时期在不同机构工作或学习,对其发表的文章要认真确认再综合起来开展后期的分析与评价报告工作,尽量避免遗漏或范围扩大。第三,数据库选择问题。评价的数据主要基于各类数据库,因此,在实际评价中应根据学科分类来甄选数据库,使评价结果更加科学合理[8]。
参考文献:
[1]Hirsch,J.E.AnIndextoQuantifyanIndividual'sScientificResearchOutputs[A].ProceedingsoftheNationalAcademyofSciences,
2005,102(46).
[2]RousseauR.NewDevelopmentsRelatedtoTheHirschIndex[J].科学观察,2006,(4).
[3]丁楠,潘有能.h指数和g指数评价实证研究——基于CSSCI的统计分析[J].图书与情报,2008,(12).
[4]BallP.Indexaimsforfairrankingofscientists[J].Nature,2005,436(18).
[5]彭爱东,于倩倩.h指数、g指数和累积影响因子在期刊评价中的相关性研究——以综合性社科期刊为例[J].情报科学,2012,(30).
月期刊平台服务过的文章录用时间为1-3个月,依据20年经验,经月期刊专家预审通过后的文章,投稿通过率100%以上!