FormoreinformationaboutSciVal,pleasevisit:/research-intelligence/scival
04.18MKT
SciVal指标手册2018中文版在ISTIC-Elsevier联合实验室的大力支持下得以顺利完成,除中信所外,我们还特别感谢来自清华大学、北京大学、上海交通大学、同济大学和山东大学等多位老师为手册的翻译和校对工作付出的辛劳。
此手册将伴随SciVal产品的发展不断更新,我们也欢迎学术界的各位同仁对手册的翻译包括SciVal产品的使用提出宝贵意见,让这个年轻而富有活力的科研工具科研更好满足中国用户的需求。
意见反馈请发送至ISTIC-Elsevier联合实验室w.xie@,zhailh@。
Elsevier科研管理解决方案团队2018年4月于北京 2018 Elsevier科研管理解决方案 SciValSciVal指标手册 版本1.02|2018年4月 赋予知识力量 作者 LisaColledge博士和ReinderVerlinde博士 版本1.022018年4月
2 Elsevier科研管理解决方案|SciVal 目录 1.0 Scopus:SciVal指标的数据源
5 1.1 Scopus数据库介绍
5 1.1.1Scopus数据库内容和SciVal
5 1.1.2图书与SciVal
5 1.2 Scopus和SciVal的数据更新
5 1.3 学者档案
5 1.3.1Scopus的学者档案
6 1.3.2SciVal的作者和研究者
6 1.4 机构档案
7 1.4.1Scopus的机构档案
7 1.4.2SciVal的机构和科研机构
7 1.5 出版物的版权属于研究机构还是研究
8 人员? 1.6 机构类型
8 1.6.1Scopus的机构类型
8 1.6.2SciVal的机构类型
8 1.7 Scopus和SciVal的期刊指标
9 2.0 SciVal及其指标 10 2.1 SciVal评价指标 10 2.2 SciVal中的指标计算和显示 11 2.2.1
指标计算所涉及的文献 11 2.2.2去重 11 2.2.3零值和空值 12 2.2.4“>当前年”的情况 12 2.2.5被引频次 12 2.2.6计算选项 13 2.2.6.1学科领域筛选 15 2.2.6.2出版社类型筛选 15 2.2.6.3排除自引 16 2.2.6.4绝对数量和百分比选项 16 示例1a:自引的排除 17 示例1b:自引的排除 18 3.0 指标的合理选择 20 3.1 明确问题 20 3.2 除了学术表现,其他影响指标值的因素20 3.2.1规模 21 3.2.2学科 21 3.2.3出版物类型 24 3.2.4数据库收录范围 25 3.2.5人为操控 27 3.2.6时间 27 4.0 SciVal指标:使用方法 28 4.1 SciVal中的指标展示 30 4.2 指标:科研产出 30 4.3 指标:期刊计数 31 4.4 指标:期刊分类计数 33 示例2:
科研产出,期刊计数和期刊分类计数36 4.5 指标:被引频次 38 4.6 指标:被引文献数量 40 4.7 指标:篇均被引 42 示例3:被引频次,获得引用的文献计数, 篇均被引频次 44 4.8 指标:施引文献覆盖国家计数 46 示例4:施引文献覆盖国家计数 48 4.9 指标:学科归一化影响力 49 示例5:学科归一化影响力 52 4.10 指标:文献合作 53 4.11 指标:文献合作影响力 55 4.12 指标:校企合作 56 4.13 指标:校企合作影响力 58 示例6:
文献合作,文献合作影响力,校企合 作和校企合作影响力 60 4.14 指标:高被引文献量 62 示例7:高被引文献量 66 4.15 指标:高百分位期刊中的发文量 68 示例8:高百分位期刊中的发文量 72 4.16 指标:h指数组 74 示例9:h指数组 78 /research-intelligence/scival
3 前言 人们经常认为这段话出自艾伯特·爱因斯坦,但实际上应出自威廉·布鲁斯·卡梅隆
1,它经常出现在前言中,
那就是:“有价值的东西不一定被计量,已计量的东西不一定有价值。
” 这段话无疑是正确的,但并不是说一切都不应被计量。
许多事物是可计量的这点非常重要,能够为科研趋势提供宝贵见地,在今天的科研界,这一点日趋重要。
工程师们知道如何以正确且负责的方式使用他人开发的技术,车主们每天都在使用他们的专业成果。
车主欢迎工程师为他们的汽车不断做出贡献,因为这会使他们的生活更为轻松。
同样的,计量学指标领域的发展也依赖计量学专业的学术研究和技术进步;越来越多的科研人员正在将这些计量学的学术成果直接或间接地应用于科学研究中。
大多数人都不会认为自己是计量学专家:本手册就以这些人为对象,旨在帮助他们正确地理解和使用计量学指标。
本手册不是一本提供计量学指标最新进展的详细学术专著,而是一本SciVal(爱思唯尔科研管理工具的组成部分)的实用工具书。
随着SciVal的产品发展,本手册也将不断更新。
本手册介绍了指标计算所需的底层数据、指标是如何被计算及展示的,以及非绩效变量(variablesbesidesperformance)如何影响指标值。
本手册还就指标的使用领域、注意事项以及如何解决缺陷问题提出了建议。
在本手册中只有一种绝对正确的指标使用方法,那就是:考虑问题时始终使用一种以上的指标,并通过同行评议和/或专家意见支持自己的结论。
如果不同类型的信息能够为彼此提供支持,那么这种“三角化”策略将有助于提高结论的可靠性;如果信息并未彼此验证,则表明这个领域仍有待进一步研究。
除此之外,再无其他非黑即白的规则。
最好的使用策略就是运用常识。
希望您觉得本手册不但有用,而且有趣。
LisaColledge博士Elsevier 2014年1月 1:/2010/05/26/everything-counts-einstein/
4 Elsevier科研管理解决方案|SciVal
1.Scopus:SciVal指标的数据源 编写本手册期间,SciVal显示的所有指标与信息均以Scopus为基础。
本节重点介绍Scopus的部分内容,有助于帮助用户理解SciVal指标,读者还可以从Scopus在线指南里2更多内容 1.1Scopus数据库介绍 Scopus拥有一个国际化的内容遴选委员会,始终独立负责Scopus内容评审和收录有关评审流程和遴选标准的信息可在网上公开查询到
3。
委员会评审的内容包括期刊、会议文集、商业杂志、丛书及单行本图书。
Scopus收录了约五千万种出版物。
参考文献列表涉及来自1996年之后发表的2900万条记录以及可追溯至
1823年的2100万条1996年之前的记录。
1.1.1Scopus数据库内容与SciVal SciVal使用Scopus数据库1996年之后的内容,以确保在SciVal里展现的被引频次是以连续年份数据为基础的。
1.1.2图书与SciVal Scopus收录的图书包括丛书和单行本图书。
“图书”在SciVal中仅指那些单行本图书;由于不具有期刊指标的特点,它们的性质有别于与丛书、期刊、会议文集和商业杂志。
在作者提供的信息允许的情况下,Scopus会将引用内容链接到图书具体章节或图书本身。
Scopus会选择建立一种链接方式而不会同时建立两种。
为显示具体章节作者的被引频次,SciVal记录链接至该章节的引用数量;为显示整部著作作者的被引频次,SciVal记录链接至该著作的引用数量加上链接至所有章节的引用数量,以确保作者获得其学术贡献产生的完整引用影响力。
1.2Scopus与SciVal的数据更新 Scopus数据库内容是每天更新的。
SciVal数据库内容是每周更新的。
SciVal采用Scopus数据,然后对其进行结构化处理,以优化其对SciVal
指标与功能的支持。
这也是SciVal数据的更新程度可能略微滞后于Scopus的原因。
1.3学者档案 1.3.1Scopus学者档案 Scopus是全球唯一对收录论文按照作者进行自动分组的数据库。
Scopus将同一位作者的所有著作归集于同一个作者标识符(即学者档案)。
学者档案有两种论文统计模式: •采用匹配算法将论文自动归入学者档案: 2:/online-tools/scopus3:/online-tools/scopus/content-overview /research-intelligence/scival
5 -此算法寻找作者姓名、归属机构、期刊组合以及学科类别的相似之处,据此对论文进行归类。
用户可能会注意到,多个姓名变体归在同一学者档案下,这也是算法的价值所在。
-作者提供的信息并不总是统一或完整的,即使统一而完整,作者也具有流动性,因此我们无法确定某些论文是否同属一位作者。
在这种情况下,我们必须在匹配准确度(或精度)与覆盖度(或完整性)之间达到平衡,提高一方就会降低另一方。
-Scopus算法更偏向于准确度,只在匹配可信度至少达到99%时才会将论文归属为该作者,也就是说,在100篇论文中,99篇将得到正确归类。
在这种准确度下,数据库的覆盖度将达到95%,也就是说,如果一位作者发表了100篇论文,Scopus会将平均95篇归属到该作者。
-以上准确度与覆盖度适用于整个Scopus数据库。
在有些情况下,大量相似姓名会加剧学者档案间论文的分散性,如众所周知的中国作者姓名。
同样的,作者姓名区别度越高,论文分散性越低,如西方国家作者。
-具有多位作者的论文将被归于多个学者档案下。
•根据反馈对论文进行手工分类。
自动匹配算法永远达不到100%准确,因为算法使用的数据不会100%完整统
一。
因此,Scopus通过使用来自行业机构的反馈主动对算法进行补充,包括开放研究者(OpenResearcher)与贡献者身份识别码(OpenResearcherandContributorID(ORCID))的反馈
4,以及来自Scopus作者反馈团队用于改进学者档案的反馈
5。
1.3.2SciVal的作者和研究者 Scopus提供的学者档案为SciVal用户提供了极大灵活性。
SciVal用户可以使用学者档案实时定义及查看全球任何研究者,无论这些作者与用户同属一所机构、或是用户在另一个国家的合作伙伴,还是与用户素昧平生的陌生人。
用户可以在其SciVal账户中定义任何数量的研究者,然后以这些研究者为基础,创造出任意数量的: •学者群组。
可以代表真实的研究团队、部门或其他组织团队、国际合作网络,或正在考虑组建的研究团队模型。
•文献集合。
包含研究者的产出,如来自同一特定归属机构的论文,或由某种奖项资助的论文。
•文献集合群组。
包含提交给国家奖项评审的文献集合,如英国的ResearchExcellenceFramework6。
SciVal中的“作者”(authors)和“研究者“(Researchers)具有不同含义: •作者是指自动创建的Scopus“学者档案”。
例如,“概况”(Overview)模块中的作者数量是指独立学档案的数量;这个数量也可能高于研究者数量,因为覆盖度为95%,意味着同一位研究者的论文可能被归于不同学者档案下。
•研究者是指人工输入的实体。
SciVal用户可以合并学者档案,删除不属于该学者档案的文章,还可检索应 4:/5:/6:http://www.ref.ac.uk/
6 Elsevier科研管理解决方案|SciVal 加入该学者档案的具体论文。
供机构使用的“档案改进服务”(ProfileRefinementService)用于建立SciVal研究者与研究者群组,该服务也采用类似的人工流程,由爱思唯尔为客户完成。
SciVal区分人工创建的“研究者”(由用户或爱思唯尔创建)与自动创建的“学者档案”。
所有人工改进会反馈给Scopus,被用于提高源数据库的质量,供全体Scopus数据用户使用。
这就意味着Scopus处理反馈后,SciVal的研究者将拥有唯一学者档案,该信息可以在新论文收入索引后自动更新。
1.4机构档案 1.4.1Scopus机构档案 Scopus是全球唯一对收录论文按单一归属机构进行自动分组的数据库。
这些隶属于同一机构的文献群组被称为机构档案,共有两种输入模式: •采用匹配算法将论文自动归入机构档案: -此算法寻找机构名称以及地址的相似之处,对论文进行归类。
用户可能会注意到,多个名称变体被归入同一机构档案下,这也是算法的价值所在。
为了对论文进行分类,Scoups使用权威数据库,该数据库含有七万多条经过人工校正的机构名称变体。
-作者提供的机构信息并不总是统一或完整的,因此我们始终无法确定某些文章是否同属一组。
在这种情况下,我们必须在匹配准确度(或精度)与覆盖度(或完整性)之间达到平衡,否则提高一方就会降低另一方。
-Scopus算法更偏向于准确度,只有在匹配可信度至少达到99%时才会将论文归为一组,也就是说,在100篇论文中,99篇将得到正确归类。
在这种准确度下,数据库的覆盖度将达到93%,也就是说,如果一个机构发表了100篇论文,平均来说Scopus会将93篇论文归于一组,而其他论文则可能被归于一个或多个组。
-具有多位作者,且作者属于多个机构的论文将被归于多个机构档案下。
•根据反馈对论文进行手工分类。
匹配算法永远达不到100%正确,因为算法使用的数据并非100%完整或统一的。
因此,Scopus使用相关机构的官方权威反馈意见对算法补充。
1.4.2SciVal的里的机构和科研机构 Scopus提供机构档案,为SciVal用户带来了极大便利:用户只需轻点鼠标,即可获得预先计算好的指标。
SciVal还可使用“科研机构群组”(GroupsofInstitutions)功能,如按照美国各州组成的科研机构群组。
SciVal区分“机构”(affiliations)与“科研机构”(institutions)这两个术语: •机构是指自动创建的Scopus机构档案。
例如,医学院可以有一个是独立于大学之外机构档案。
•科研机构是指一组互有关联的机构档案,由人工创建,作为用户使用SciVal的便利起点;目前SciVal已经定义了约4,500家机构供用户使用。
任何一个医学院总是和其所属大学在SciVal里的科研机构分组在一起。
/research-intelligence/scival
7 1.5出版物的版权属于机构还是研究人员? 研究人员是可流动的,很有可能在其职业生涯中更换所属机构。
这就提供了论文“属于”机构还是研究人员的两种视角: •“机构视角”通常认为,即使作者已经调离机构,其发表的论文仍然应属于该机构。
换句话说,虽然作者已经调走,但论文不具移动性。
•“研究人员视角”通常认为,论文应和其作者一样具有移动性,应随着作者的职业发展而不断改变归属机构。
•人们需要在不同情况下使用不同视角回答不同问题。
SciVal同时提供这两种视角,因为论文同时与机构档案和学者档案建立联系,而机构档案和学者档案又互相独立: •SciVal中的机构与机构群组采用“机构视角”•SciVal中的研究研究人员、研究人员群组、文献集合与文献集合群组采用“研究人员视角” 1.6机构类型1.6.1Scopus的机构类型 Scopus根据机构的主要功能为机构档案分配机构类型。
机构的主要功能一般可以从机构的名称上了解,也可通过机构的网站进行确认。
Scopus为机构分配以下机构类型:大学、学院、医学院、医院、研究所、公司、法律事务所、政府、军事组织、非政府组织。
1.6.2SciVal的机构类型 SciVal将功能相似的Scopus机构类型合并在一起以简化用户操作。
在SciVal里面,一共有以下五种机构类型:学术机构、公司、政府机构、医疗机构及其他机构。
这五种机构类型分别包括以下不同的Scopus机构类型:•学术机构:大学、学院、医学院和研究所•公司:公司与法律事务所•政府机构:政府与军事组织•医疗机构:医院•其他机构:非政府组织
8 Elsevier科研管理解决方案|SciVal 1.7Scopus和SciVal的期刊指标 Scopus和SciVal采用两种期刊指标。
这两种指标由学术研究团队开发,指标的计算方法已经发表在同行评议期刊上。
这两种指标的信息可在网上查看到,所有指标值均可免费获取
7,这两种指标是: •SNIP8。
篇均来源期刊归一化影响力指数(Source-NormalizedImpactperPaper)是“单篇论文原始影响力”(RawImpactperPaper,即期刊实际收到的单篇论文引用量)与“引用潜力”(CitationPotential,即单篇文章在该期刊领域内预期引用量)之间的比值。
SNIP考虑到了不同学科的特点,可用于比较不同领域的期刊。
Scopus中所有期刊的SNIP指标的全球均值为
1。
•SJR9。
SCImago期刊排名(SCImagoJournalRank)是一个基于声誉的指标,其算法与谷歌PageRank类似。
这种指标根据引用论文所在期刊的领域、质量与声誉来计算引用文献的引用权重评估引用值,因此“每篇引用文献的引用权重值都是不相等”。
SJR还考虑到了不同学科学术行为的区别,可用于比较不同领域的期刊。
Scopus所有期刊的平均SJR值为1.000。
期刊指标不适用于行业杂志。
因为SNIP和SJR值的计算是以学术期刊为基础的,所以单行本图书也没有SNIP和SJR值。
7:8:/science/article/pii/S99:/science/article/pii/S6 /research-intelligence/scival
9 2.SciVal与计量指标 2.1SciVal中的计量指标 SciVal提供范围广泛的指标:•可灵活定制分析范围,从多角度诠释问题以适应不同用户的偏好;•可确保用户能够交叉验证结论的“有效性”。
在基于实证寻找问题的合理解释时,我们建议您至少选择两个计量指标来获取分析结果,如果这些结果能够相互加强印证结论,那么用户就可以更加确信结论是有效的; SciVal提供的指标共分为6组,一个指标可能被会被分在多个组别中,如表1所示:•科研效率指标集(ProductivityMetrics):提供一个实体科研产出数量的相关信息;•引用影响力指标集(CitationImpactMetrics):基于多种类型的被引频次计算,获取一个实体科研产出的影响力信息;•科研合作指标集(CollaborationMetrics):提供一个实体科研合作的信息;•学科指标集(DisciplinarityMetrics):提供一个实体科研产出基于学科的分析信息;•雪球指标集(SnowballMetrics)10:该指标集由知名研究密集型大学定义并背书,主要在机构发展战略分析方面用于获取深入的洞察力:-这些被认可且经过测试的指标定义在免费共享的“雪球指标集应用手册”11中可以找到;雪球指标集正致力于成为高等教育领域的全球化标准; -这些指标可被任何人按照自己的目的所应用。
爱思维尔公司支持雪球指标集成为公认的行业标准,并在相关的系统和分析工具中实现了这些指标,其中就包括了SciVal平台; -雪球(Snowball)指标在SciVal的使用界面中采用雪花标志标识,如图所示; •与“体量”成正相关指标集(Powermetrics):这组指标的值随着对应实体规模的增大而增大。
例如:大机构与小机构相比因为规模大,因此通常情况下会有更多的科研产出。
10:11:/metrics 10 Elsevier科研管理解决方案|SciVal 科研产出(ScholarlyOutput)期刊数量(JournalCount)期刊学科分类数量(JournalCategoryCount)被引频次(CitationCount)被引文献数量(CitedPublication)篇均被引频次(CitationperPublication)引用国家数量(NumberofCitingCountries)归一化影响因子(Field-WeightedCitationImpact,FWCI)合作(Collaboration)合作影响力(CollaborationImpact)校企合作(Academic-CorporateCollaboration)校企合作影响力(Academic-CorporateCollaborationImpact)高被引文献(OutputsinTopPercentiles)高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)h指数(h-index) 生产率 引用影响力科研合作 学科指标 雪球指标“体量”指标 表1:SciVal中的计量指标集。
其中与“体量”成正相关指标集(Powermetric)列中半阴影格对应的指标只有选中“绝对数值”选项时,才是一个“体量”指标(Powermetric);否则,如果选中“百分比”选项,则不是“体量”指标(Powermetric)。
2.2SciVal中计量指标的计算与展示 2.2.1计量指标计算所涉及的文献 理想的状况下,每篇文献的信息是充分完整的,那么计算每个指标时所有计算范围的文献都应该被计算在内。
但是实际情况并非如此,比如:文献作者有时未提供完整的机构署名信息,某些文献由于所在期刊刚被Scopus收录,导致没有对应的期刊计量指标……如果文献缺乏必要的信息就会被排除在指标计算之外。
2.2.2去重 SciVal允许用户将多个较小的实体聚合为一个实体进行研究。
例如:美国各个州由其各自涵盖的研究机构实体聚合而成,国家实体由多个地理区域实体聚合而成。
同一篇文献可能属于多个小的实体,并可能被多次添加到聚合实体中。
例如,作者R1与作者R2合作发表了文献P1,此时,P1既属于R1也属于R2。
如果R1和R2同属于一个研究组织,针对此研究组织进行计量分析时,会出现P1出现两次的情况。
SciVal的去重功能使一篇文献即使由多个作者合作完成,在聚合实体中也只被计为一篇文献。
一个实体(聚合实体)所涵盖的所有文献都是唯
一、不重复的,因此用户在创建聚合实体时,可以确认相关的文献集合已经是SciVal去重后的结果。
在上述案例中,P1在R1和R2组合而成的实体中只会被计为1篇文章。
/research-intelligence/scival 11 2.2.3零值和空值(Null) SciVal的指标解释中,零值和空值(没有数值)具有不同的含义。
比如科研产出(ScholarlyOutput)这个指标,要计算一个实体的文献产出数量。
如果该实体在统计时间段内没有文献产出,则科研产出指标显示为零。
缺少发文对理解实体的学术活动是非常重要的,因此学术产出这个指标绝不会出现空值。
而被引频次(CitationCount)这个指标就不是这种情况,被引频次计算实体的文献被引用的次数。
在统计时间段内,如果实体没有发表文献,那么显示它的被引频次为零是没有意义的。
没有发文自然不能得到引用,这与实体有文献发表,却没有得到任何引用是不同的。
因此,SciVal对以下两种情况进行了区分: •如果一个实体在统计的时间段内有文献发表,但是没有得到任何引用,那么被引频次(CitationCount)就显示为零值。
•如果一个实体在统计的时间段内没有文献发表,那么这个实体就不能在该时间段内得到任何引用。
在这种情况下,被引频次就显示为空值(Null)。
例如,用户可能会注意到在标杆分析(Benchmarking)模块中如果按时间查看指标时,由于有空值出现,曲线会出现小段缺失。
同样的处理原则也适用于其他指标。
例如:如果没有文献发表,也就不会存在国际合作。
高被引文献(OutputsinTopPercentiles)这一指标在计算当年的数值时,只能在当年7月1日之后才被计算出来。
在此之前,当年的指标将显示为空值。
最主要的原因是文献的被引频次具有时间累积性,当年发表的文献由于刚刚发布,还没有累积足够的被引频次,此时文献按被引频次高低的百分比划分,无法划分。
2.2.4“>currentyear”的情况 Scopus收录的内容很大一部分是期刊。
出版商有时会将期刊的某些卷期在它们尚未正式以纸媒方式出版前就在线发布出来。
例如,2013年底,用户在Scopus数据库就可以看到某些出版年份为2014年的,甚至更晚年份的文献。
SciVal极为重视数据的及时性,在这种情况下,数据中所有的信息都会呈现给用户。
所有早于未来纸媒出版日期,提前在线发表的文献,出版年被表示为“>current。
比如在2013年会出现“>2013”,在2014年会出现“>2014”,等等。
2.2.5被引频次(Citationcounts) SciVal中的被引频次是指文献发表以来截止到统计日期获得的总被引次数。
引文影响力指标(CitationImpact)指标在SciVal中往往用按年份统计的图或表显示,以此来表明其趋势。
统计的起始年份指的是文献发表的年度,而不是文献被引用的年度。
较早发表的文献往往比新发表文献的被引频次高,这是因为前者有更长的时间被后续研究所引用。
对于被引频次(CitationCount)和篇均被引频次(CitationsperPublication)这样的指标,计算过程中没有考虑时间累计的影 12 Elsevier科研管理解决方案|SciVal 响,用户往往会注意到指标曲线在最近几年的表现为“下降”趋势。
尽管有“下降”趋势的存在,相似实体之间的指
标比较仍然是有意义的。
这是因为时间累计因素对所有实体的影响均相同。
如果用户想避免这种现象,他们可以选择归一化影响因子(Field-WeightedCitationImpact)这类计算过程中考虑了时间累计因素的指标。
2.2.6计算选项 SciVal用户在使用计量指标方面会有不同的需求。
有些需求用可视化数据的方式就可以满足(如趋势信息),但是有些需求需要改变计量算法。
例如: •一位学者,如果他是学术期刊的编辑,通常需要发表社论(Editorials)。
这些社论会增加他科研产出指标的值,相应的引用影响力指标也会增加。
在理解这位学者的影响力时,把他所有的科研产出看作一体,包括社论,进行影响力分析是公允的。
因为作为学术期刊的编辑,撰写社论同样是他们对学术做出贡献的重要组成部分。
然而,如果把这位学者同那些不是期刊编辑的学者进行比较时,排除掉那些社论及其所产生的引用或许更加公平。
•自引是指作者在新发表的文献中引用自己以前的研究成果。
自引通常是正常的学术行为,作者有责任确保读者能够注意到与其研究成果相关的其他工作。
然而,一些用户在进行文献计量分析时更希望在计算引用相关指标时排除掉著者自引的情况,尽管这对于另外一些用户来说或许并不重要。
这些计算偏好没有绝对的正确或错误之分。
虽然在某些情况下,一个选项可能会变得非常重要。
在SciVal中会提供相关选项,使得用户可以自己选择这些计算参数。
每个指标都有自己的一组计算可选项,相关可选项汇总在表2中。
/research-intelligence/scival 13 Scival默认 研究领域筛选 (SubjectAreafilter) 文献类型筛选(Publicationtypefilter) 排除自引(Self-citationexclusion) 绝对数值或百分数(Absolutecountorpercentage) 无筛选 无筛选 未排除 百分数 科研产出(ScholarlyOutput) 期刊数量(JournalCount) 期刊学科分类数量(JournalCategoryCount) 被引频次(CitationCount) 被引文献数量(CitationPublications) 篇均被引频次(CitationsperPublication) 引用国家数量(NumberofCitingCountries) 归一化影响因子(Field-WeightedCitationImpact) 合作(Collaboration) 合作影响力(CollaborationImpact) 校企合作(Academic-CorporateCollaboration) 校企合作影响力(Academic-CorporateCollaborationImpact) 高被引文献(OutputsinTopPercentiles) 高百分位期刊中的发文量(PublicationsinTopJournalPercentiles) h指数(h-index) 学科主分类合作 校企合作百分位 或子类(Colla(Academic-(Percentile (Mainor boration)Corporatelevel) Sub-Category) Collaboration) 期刊指标(Journal Metric) 数据范围(Data Universe) 主分类 国际合作 包含此类合作 10% SNIP 全球 表2:SciVal相关指标的计算可选项 14 Elsevier科研管理解决方案|SciVal 2.2.6.1研究领域筛选(ResearchAreafilter) 研究领域筛选将一个实体涉及的文章限定在特定的学科领域,基于限定后的文章计算相关指标。
如果采用期刊分类作为研究领域分类依据,如所附界面截图所示,期刊的主分类及其子类均可作为研究领域进行筛选。
用户自定义的研究领域也可以在某些模块中作为筛选依据,如截图中的研究领域“石墨烯(Graphene)”和“疟疾(Malaria)”,即为用户自定义的研究领域。
研究领域筛选(ResearchAreafilter)仅用于限定所选实体涉及的文献。
它不会滤除文献获得的引用,进而影响引文影响力(CitationImpact)系列指标的计算。
即计算被引频次时不会考虑施引文献的研究领域。
有些指标并没有经过领域归一化处理。
由于不同学科领域具有不同的发文和引用规律,未归一化处理意味着学科的差异性在指标计算过程中未被考虑。
因此在进行非归一化指标值对比时,用户往往难以区分值的差异是来源学科的不同,还是实体表现的不同。
当然在相同的学科中进行比较时,这些非领域归一化的指标是非常有用的。
对于非归一化处理的计量指标比较,同一领域内相比才有意义。
用户在实际使用非归一化指标值时可以: •使用研究领域过滤器当选定一个非归一化的指标来比较涉及多个研究领域的实体(如机构或国家)时,利用研究领域筛选,使得这些实体在选定的研究领域具有可比性。
•使用领域归一化指标如归一化影响因子(Field-WeightedCitationImpact),该指标计算过程中对学科进行了归一化处理,消除了学科领域差异性。
SciVal的默认设置是无研究领域筛选。
2.2.6.2出版物类型筛选(Publication-typefilter) 出版物类型筛选用于限定文献类型,如:学术论文、评论、书籍等。
当用户在分析时判断区分文献类型对分析结果很重要时,可以应用该筛选功能,例如: •区分原创性研究论文(articles)和领域专家撰写的综述文章(reviews); •在工程和计算机领域中,有时会更加关注会议论文(conferenceproceedings); •在比较作为期刊编辑的学者和普通学者时,前者有机会发表社论(editorials)。
出版物类型筛选(Publication-typefilter),仅用于限定所选实体涉及的文献。
该筛选功能不会滤除文献得到的引用,进而影响引文影响力(CitationImpact)系列指标的计算,计算被引频次时不会考虑施引文献的出版物类型。
唯一的例外是高被引文献(OutputsinTopPercentiles),使用该筛选功能会限定用于产生引证阈值的数据。
SciVal的默认设置是无出版物类型筛选。
/research-intelligence/scival 15 2.2.6.3排除自引(Self-citationexclusion) 自引是指一个实体在新发表的文献中引用自己以前的研究成果。
自引通常被认为是对个人学术活动的连贯性梳理,期刊自引,机构自引,国家或地区自引是相同的活动在不同层次的表现。
自引行为没有本质上的错误。
这是正常的和预期会发生的学术行为,新的科研成果根植于过往的工作和论文成果;在新的成果中提醒读者关注过往重要的和相关的成果,可以帮助读者深入理解新成果。
事实上,与新成果文献最为相关并且需要关注的文献可能就是同一实体过往发表的文献,让读者注意到作者先前已发表的最相关的文献,也是作者的责任。
自引也可能被滥用。
虽然极为罕见,但一些违反学术道德的自引导致了自引行为有些蒙羞。
在进行引用影响力指标集分析时,SciVa为用户提供“排除自引(Self-citationexclusion)”的选项,用户可以自行判断一个实体的自引率是否在正常范围内。
SciVal可以区分作者、机构、国家或地区层面的自引,并依赖所分析实体的类型施加合理的排除,不需要用户特别干预。
SciVal的默认设置是不排除自引。
实例1a和1b展示了SciVal如何界定和排除自引。
2.2.6.4绝对数(AbsoluteNumber)和百分比选项(Percentage) SciVal中一些指标集的数值的计算提供两种选项:“绝对数值(AbsoluteNumber)”或“百分比(Percentage)”: •当比较不同规模的实体时,建议用户选择“百分比(Percentage)”选项,以达到规模归一化的目的; •当涉及出版物数量量级时,建议选择“绝对数值(Absolutenumber)”选项。
SciVal的默认设置为“百分比”。
16 Elsevier科研管理解决方案|SciVal 实例1a:自引的排除 案例描述:用户想要考察一个实体,可能是国家、研究机构或者研究者,这个实体由1篇文献(PP)构
成,共获得6次引用,分别来自文献P1、P2、P4、P5、P6、P7。
文献 PP 作者 AA 机构 II 国家 CC 文献P1P2P4P5P6P7 PP被以下文献所引用 作者A1AAAAAAA2A2 机构I1I2I3IIIII3 国家C1C2CCCCCCCC 问题:如果某个指标的计算提供“排除自引(nottoincludeself-citation)”选项,而用户选择了该选项,会发什么呢? 回答:如果正在被考察的实体是国家CC,则来自P4、P5、P6、P7的引用会被认为是“自引”,因为它们的署名国家与实体相同,即国家CC;在计算指标时这4次引用将不会被计算在内。
回答:如果正在被考察的实体是机构II,则来自P5、P6的引用会被认为是“自引”,因为它们的署名机构与实体相同,即机构II;在计算指标时这2次引用将不会被计算在内。
回答:如果正在被考察的实体是研究者,其中包含作者AA,则来自P2、P4、P5的引用会被认为是“自引”,因为它们的作者同时也是实体中的作者,即作者AA;在计算指标时这3次引用将不会被计算在内。
无论考察的实体是什么,来自P1的引用都不会被认为是自引。
/research-intelligence/scival 17 实例1b:自引的排除 案例描述:用户正在考察一个实体,可能是国家、研究机构或者研究者,这个实体由3篇文献(P4、
P5、P6)构成: -文献P4有2个作者:A2和A5。
他们均署名机构是I2,国家是C2。
-文献P5有2个作者:A1和A3。
作者A1有两个署名机构I1和I3,分别对应国家C1和C2;作者A3的署名机构是I2,国家是C2。
-文献P6与文献P5的作者相同:A1和A3。
作者A1仍有两个署名机构,其一仍为国家C2的机构I3,而第二个则变为国家C4的机构I5;作者A3署名机构也变为I5,国家C4。
文献P4、P5、P6共得到3次引用,分别来自文献P1、P2、P43。
文献P4P5 P6 作者A2A5 A1 A3A3 A1 机构I2I2I3I1I2I5I5I3 国家C2C2C2C1C2C4C4C2 文献P1P2 P3 P4、P5和P6被以下文章引用 作者A1A3 A3 A4A4A5 A6A2 机构I6I6I2I3I3I4I2I6I6I4 18 国家C4C4C2C2C2C3C2C4C4C3 Elsevier科研管理解决方案|SciVal 问题:如果某个指标的计算提供“排除自引(nottoincludeself-citation)”选项,而用户选择了该选项,会发什么呢? 回答:如果正在考察的实体为国家,分别为C1、C2、C4或者它们的组合时,那么:-P1对P6的引用是自引,因为署名国家都有C4-P2对P4、P5、P6的引用均是自引,因为署名国家都有C2-P3对P4、P5、P6的引用均是自引,因为署名国家都有C2,并且P3和P6的另一个署名国家也相同,即C4-P1对P4、P5的引用不是自引,因为它们没有相同的署名国家 回答:如果正在考察的实体为机构,分别为I1、I2、I3、I5或者它们的组合时,那么:-P2对P4、P5、P6的引用均是自引,因为P2和P4、P5有相同的署名机构I2,和P5、P6有相同的署名机构I3-P3对P4、P5的引用均是自引,因为P3和P4、P5有相同的署名机构I2-P1对P4、P5、P6的引用均不是自引,因为它们没有相同的署名机构-P3对P6的引用也不是自引,它们也没有相同的署名机构 回答:如果正在考察的实体为研究者,并包含A1、A2、A3、A5或者它们的组合时,那么:-P1对P5、P6的引用是自引,因为署名作者都有A1和A3-P2对P5、P6的引用均是自引,因为署名作者都有A3-P3对P4的引用是自引,因为署名作者都有A2和A5-P1、P2对P4的引用不是自引,因为它们没有相同的署名作者-P3对P5、P6的引用也不是自引,它们也没有相同的署名作者 /research-intelligence/scival 19
3.指标的合理选择 在进行科研管理决策时,理想状态是拥有3种参考信息:同行评议、专家意见和基于数据的事实信息。
当
这些互补的信息交叉验证并给出相似的结论时,用户就可以更加确信自己决策是正确的;当这些信息有相互冲突时,则提醒人们需要花时间去做更深入的调查研究。
基于数据的事实信息可以更好地为解决问题提供多个视角。
通常情况下,针对一个问题会向多人征询专业意见,同时引入多人进行同行评议也非常典型;同理,通过选取两、三个甚至更多不同指标交叉验证从而获得的事实信息也能确保结论的高可靠性。
除了对问题进行多方面分析之外,指标选择并没有严格的规定。
最合理的指标选择通常取决于用户的特定问题。
最好的办法是能够突出某些要点,这些要点通常情况下是那些需要被记住的、用户可应用常识解决问题的关键点。
SciVal提供了多种指标,使得用户能得到可以交叉验证所需的事实信息,以迎合用户可能提出来的大量且多样
的问题。
它基于丰富强大的信息资源,帮助用户凝练观点,这些观点可以对其他来源的信息提供有益的补充。
本章的主要内容将介绍影响指标的各种因素,如何恰当地选择指标。
3.1明确问题 使用数据和度量指标进行决策的目标是:任何指标中可察觉到的差异都应该反映出学术表现的差异。
如果用户选择的指标有助于回答提出的问题,首先必须取决于是否满足两个重要的因素: •问题被明确阐述 •用户明白,除了学术表现之外还有别的因素会影响指标的值。
而这个因素是否重要,也只有当问题被明确阐述之后才可以做出判断。
典型的问题通常有三种: •绩效评估,比如国家为分配资助基金而对科研机构进行的绩效评估,或者是上级在讨论下属职业发展所作的绩效评估。
在上述情况下,为了确保评价的公平性,除了学术表现指标的绝对差异之外,考量其他变量也是非常重要的,比如,在化学学科和免疫学科之间进行比较时,如果使用的指标未考虑到免疫学科倾向于有更高的科研产出量和引用率,那么这种比较是不可取的。
•成果展示,比如在撰写竞争性的基金申请书或者吸引研究生来研究机构工作这些情况下,用户的目标通常是找到更好展示分析目标成果卓越度的方法,此时他们可能更愿意使用那些有利于己方的指标。
比如,大型机构可能会选择“能力指标(powermetrics)”这类指标,因为这类指标的值随着分析对象规模的增大而变大;反之,小型机构可能会选择规模归一化后的指标。
•特定场景,比如为研究团队招聘或者院系重组提供支持。
学术表现之外影响指标值的因素是否重要,取决于特定场景的具体模式。
3.2除了学术表现,其它影响指标值的因素 本节讨论的是,绩效之外可能影响指标值的六种因素: •规模 •学科 20 Elsevier科研管理解决方案|SciVal •出版物类型•处理方法 •数据库收录范围•时间 SciVal提供的相关指标是否受到这些因素的影响,详见表3所示。
如果针对特定问题,未考虑到某些非常重要的因素,SciVal将为用户提供功能选项或其他指标测度;在本手册后续的章节会进行详细阐述。
科研产出量(ScholarlyOutput)期刊计数(JournalCount)期刊分类计数(JournalCategoryCount)被引频次(CitationCount)获得引用的文献数量(CitedPublications)篇均被引频次(CitationsperPublication)施引文献覆盖国家计数(NubmerofCitingCountries)学科归一化影响力(Field-WeightedCitationImpact)文献合作(Collaboration)合作影响力(CollaborationImpact)校企合作(Academic-CorporateCollabration)校企合作影响力(Academic-CorporateCollaborationImpact)高被引文献(OutputsinTopPercentiles)高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)h指数(h-indices) 规模归一化?
学科领域归一化?
出版物类型归一化?
与数据库收录范围相关?
不易人为操控?
无时间相关性?
表3:SciVal指标的特性。
在“规模归一化”列中半阴影格对应的指标,SciVal提供两种选项:“百分比(Percentage)”和“绝对数值(AbsoluteNumber)”,前者为规模归一化的选项,后者则不是。
3.2.1规模 有些指标的值会随着分析对象规模的增大而增加,比如显示分析对象生产力的“科研产出(ScholarlyOutput)”、被引用总量的被引频次(CitationCount)”。
这些指标在本指南中被称为“能力指标集(Powermetrics)”(如表1所示)。
在绩效评估时,考虑分析对象的规模差异往往是很重要的;比如,篇均被引频次(CitationsperPublication)就考虑到了分析对象学术产出规模的差异,它对于揭示每条记录的被引效率来说很有帮助。
然而,当展示成果时,“能力指标集(Powermetrics)”对于大型研究机构来说比较有利,因为它在这些指标上的表现往往看上去更好;被引数量亦如此,规模较大合作网络的被引量往往比小的研究团队的被引量更多。
3.2.2学科 不同学科的学术工作在研究方法和交流方式上存在显著的差异。
这些行为差异不存在谁好谁坏的问题,仅仅是与特定研究领域相关的一个事实。
/research-intelligence/scival 21 任何被引频次类或篇均被引频次方面的指标都能有效显示这种学科差异。
比如,神经科学领域在上述指标上
的得分往往明显高于工程学,但显然不能说明神经科学通常比工程学“好”。
这类指标没有考虑到学科的差异性,我们不建议使用它们进行学科之间的直接比较;我们推荐采用学科归一化的指标,比如“学科归一化影响力指标(Field-WeightedCitationImpact)”、“高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)”,以及免费的期刊计量指标SNIP和SJR12等等。
这些行为差异不只影响被引频次类或篇均被引频次方面的指标,实际上它们会影响在科研管理中使用到的所有指标,这其中就包括SciVal中的指标。
是什么引起了这些差异呢? •出版频率:与数学领域的学者相比,化学工程等领域的研究者发表论文更为频繁; •参考文献列表的长度:毒理学等领域文后所列参考文献往往比社会科学的要多得多; •合著者的数量:物理学研究的合作通常比人文艺术领域要多,因而每篇论文的合著者更多。
图1给出了所有学科的学术行为典型分布特征。
神经科学生命科学药理学和毒理学化学和化学工程 物理学环境科学健康科学地球科学 生物学社会科学材料科学与工 程学数学与计算 机科学艺术与人文 高 •出版频率•参考文献列表长度•合作者数量 低 图1:不同学科的学术行为特征 学科差异性对指标来说意味着什么?神经科学和生命科学的大多数指标值要高于材料科学和计算机科学;这并不足以反映学科表现,仅仅反映了这些学科的特定研究方式。
当分析目标是展现神经科学的某项学术研究的成果时,直接使用这些指标是恰当的,但是在进行绩效评估时就必须意识到这种学科差异对指标的影响。
如果用户需要进行学科之间的比较,建议: •使用“研究领域筛选(ResearchAreafilter)”功能:当比较涵盖多学科的分析对象(比如机构或国家)时,使用该功能可以聚焦于这些分析对象都有的学科领域; 12: 22 Elsevier科研管理解决方案|SciVal •选择领域归一化后的指标(field-normalizedmetrics),如领域归一化影响力(Field-WeightedCitationImpact)指标。
值得注意的是,当考虑到学科对指标值的影响时,有许多定义学科的方法: •期刊分类(JournalClassifications)可能是定义学科最常用的方法, -比如,Scopus将其索引的期刊分为27个主类别(MainCategories),又细分为300余个子类别(Sub-Categories);巴西CAPES基金13,也像其他许多组织一样,有自己的期刊分类; -这些分类为用户使用SciVal等工具带来了很大的好处:无论用户调查何种分析对象,都能使用具有相同含义的分类。
比如:在不同研究机构里,化学系的涉及涵盖的研究领域和方向可能有所不同,此时进行化学的基准对标分析会有问题。
如果用户利用某一特定的期刊分类对这些研究机构的科研产出进行筛选,就可确信这是在相对具有一致定义的化学学科中进行的横向比较。
正是上面的原因,SciVal中的“研究领域(ResearchAreafilter)”提供基于期刊分类的数据筛选; -期刊分类的缺点是,它们往往因为体系非常庞大而很难及时跟上研究的最新进展;另外期刊的分类决定了期刊所包含的每一篇文章的分类,过于武断。
•文献级别的分类(Publication-levelclassifications)正受到越来越多的关注,这源于学术界学科演化速度的加快以及处理海量数据集技术的进步: -这种分类并不像期刊分类那样武断地将期刊的学科类别直接赋予期刊中的文献,而是依据文献的参考文献以及引用它们的文献来确定分类; -学者看待研究领域的方式是不断变换的,文献级别的分类对于跟上他们的步伐来说十分有用,而且有助于揭示新生、新兴领域。
SciVal竞争力图谱中展示的全球研究优势,因为采用了文献级别的分类才如实地反映出当前研究热点,它呈现出近期出版物如何引用之前作品。
基于同样的原因,SciVal中的学科归一化影响力指标(Field-WeightedCitationImpact)时也采用了文献级别的分类。
-文献级别的分类缺点是: -有些文献往往不易被分类,比如当文献没有或只有一个很短的参考文献列表,而且/或者它还没有被引用过的时候; -要实现一个不断变化的分类体系,计算成本会非常高; -由于引文模式变化引起的分类频繁变化,降低了指标计算中底层数据的透明度。
•用户自定义的学科(User-defineddisciplines),比如通过在数据库的标题和摘要中选取特定检索关键词来定义: -用户自定义学科的优点在于:确保用户能够自己定义他们的研究领域,只要这对于用户和他们的研究问题来说是有意义的即可。
这是因为学者开展的研究可能并不能恰好符合已有期刊分类以及同行们此前的引用 13:/en/Programs/CAPES /research-intelligence/scival 23 行为;而且当学者刚开始关注一个新的领域时,即使是文献级别的分类也无法探测到该领域开始形成的最
初阶段。
-用户定义学科的缺点是这种定义很可能是独特的,这为其他想要使用或者证实这些自定义领域的人带来了挑战。
3.2.3出版物类型 不同类型出版物的引用率往往不同。
一个众所周知的例子是综述文章往往比原创性文章吸引到更多的引用,事实上其它不同类型文章的引用率也有差异,如图2所示: 图2:Scopus中不同类型文献的引用率。
数据范围是2008-2012年期间发表的文献截至2013年八月的被引频次。
CitationsperPublication eport rticle Bookrticle apter aper view ationitorialratum ress etterL Noteeviewurvey tR
A essA Chok enceP ceRe issert Ed Erle-in-
P RortS AbstracBusinBoonfernferenDArticSh
C Co 图2的横坐标,从左至右依次是:摘要报告、论文、图书、商业论文、书的章节、会议论文、会议评论、学位论文、社论、勘误、待刊论文、书信、注解、综述、简短调查;纵坐标为篇均被引频次。
如果需要评估整体科研成果的学术表现,或期刊编辑希望证实期刊总体生产率并保持社论对引用的积极影响(自引),文献类型的差别可能并不重要。
不过在有些情况下可能需要关注特定的文献类型,例如:工程与计算机科学领域有时需要特别关注会议论文;而在比较常撰写社论的期刊编辑和不担任期刊编辑的科研学者时,则需要更多地关注原创研究论文。
如果出版类型对于引用的影响对于用户要分析的问题来说需要去除,建议他们使用以下方法: 24 Elsevier科研管理解决方案|SciVal •应用文献类型筛选(Publication-typefilter)功能 •使用学科归一化影响力指标(Field-WeightedCitationImpact)(该指标对出版物类型进行了归一化处理) 3.2.4数据库收录范围 数据库对于其所收录的信息内容有专门的指南文档。
Scopus根据其收录政策14遴选契合其目标的信息内容;该政策具有选择性,并不包括全球范围内的每一篇文献。
这意味着分析目标所发表的某些文献如果没有被Scopus索引,也就不能参与到SciVal指标计算中。
数据库的收录范围涵盖下述两个方面: •地理范围:Scopus索引的内容来自全球5000多家出版社。
从图3Scopus所收录来源文献的地理分布图可以看出这些出版商分布于全球,尤以美国和英国更为集中(颜色最深)。
这一地理覆盖范围应当支持对于全球关注话题的全面分析;然而,对于主要是地域性研究的领域(比如民族文学、历史、文化)来说,Scopus可能无法提供充分完整的数据。
•学科范围:Scopus持续扩张的收录内容意味着其覆盖的学科范围将会不断变化。
我们可以通过新出版文献的引文收录情况来估计学科范围:这些引文能链接到Scopus数据库记录的比例被假设为代表学科的已覆盖率;引文没有被数据库收录的话就被假设为缺乏覆盖。
此方法估算出的是最低的覆盖水平,实际的学科覆盖率可能比图4所示的要高几个百分点。
图3:截至2013年1月,Scopus来源文献(期刊、会议录和图书等)的地理分布。
来源文献所属国为出版商版权所在国。
0-5,000代表来源文献的密度。
14:/online-tools/scopus/content-overview /research-intelligence/scival 25 链接至Scopus1995之后记录的引文 链接至Scopus1996之前记录或的不在Scopus中引文 neralcesitiesogytingringGeScienumanrounginee logicalandHleculaandAicalEn Bioland Arts ndMo entm Chem ticsaanage lturaricu ,Geneess,
M AgemistryBusin Bioch istrym cience iences iences ance CheuterSionScaryScndFin CompDecistricsandome arthaEcon Eics, nom Eco Energyeeringienceology cience aticsm dicine cience ursing utics nomyhologyienceserinaryntistryssions EnginntalScicrobirialsSMathe me ndM ateM MeNeuros
N acem Astro Psyc ialSc Vet arand Soc dPhcs DehProfeealt Environlogya gyanPhysiH uno icolo m Tox Imlogy, aco Pharm 图4:Scopus收录文献的学科覆盖范围估计。
这里用到了发表于2008-2012年间文献的引文,由于Scopus的引文索引始于1996年,所以发表于1996年之前的引文记录没有被计算在内,这造成图中的学科覆盖率低于实际情况。
此分析所用数据截至2013年8月。
图4的横坐标依次为:综合,农业与生物学,艺术与人文,生物化学、遗传学与分子生物学,商业、管理与会计学,化学工程,化学,计算机科学,决策学,地球与行星科学,经济学、计量经济学与金融,能源,工程学,环境科学,免疫学与微生物学,材料科学,数学,医学,神经科学,护理学,药理学、毒理学与药剂学,物理与天文学,心理学,社会科学,兽医,牙科,医疗专业人员 在与同行进行大数据量集级别上的比较时,分析对象的科研产出有一些被遗漏通常是可以接受的,这是因为数据库收录内容的缺失对于“大”分析对象的影响是一样的,并不会影响到分析对象之间对比的有效性。
但是,要注意的是,当对比“小”的分析对象时,即使一篇文献的遗漏可能就会造成很大的消极影响,比如,在评价某个学者的学术表现时,他所发表文献或者引用他的文献如果没有全部被数据库收录,指标数值将会受到影响。
分析对象的“大”与“小”是一个需要判断的问题,而且也因学科不同而异。
解决这个问题的唯一方式就是在使用SciVal支持决策时,保持谨慎并运用常识。
数据库收录范围影响方面的问题常常与人文艺术和社会科学有关:SciVal中的指标在这些领域里有用吗?在某些情况下,它们是有用的: •理论上,SciVal所支持的决策应当建立在同行评审、专家意见以及数字实证基础之上。
除了文献数量及其影 26 Elsevier科研管理解决方案|SciVal 响力,还有基金获取情况、创新性、社会影响力等都应该在评价中被考虑,尽管后面的信息尚未被SciVal收
录。
这对于所有学科都适用,人文艺术和社会科学领域也不例外。
•对于人文艺术和社会科学领域来说,它们文献的学科覆盖率在Scopus或者其他商业数据库中往往都较低,这是个需要被进一步关注的问题。
这种现象也是该领域学者出版行为的一个自然结果,他们的科研成果往往是出版独立的书,而书与连续出版物之间的关联很难被捕捉到,尽管Scopus现在已专注于增加对书的收录。
不过,如果牢记针对分析对象规模的指导方针,还是可以从SciVal中获取关于这些领域学术表现有价值的信息。
3.2.5人为操控 有些情况下,可以利用人为操控以提升某些文献计量指标值。
例如,为了提升报告上的数字而将一些研究单位组合在一起以扩大规模,从而在使用能力指标集“Powermetrics”时提高业绩表现。
另一个例子是自引。
自引从本质上来说并无不妥:它是一种正常的学术行为,因为研究总是建立在之前发表的成果之上,而且作者有责任为读者提供以往的资料作为参考以帮助他们理解最新的进展。
然而,这种行为易遭滥用,比如某些学者可能会选择引用自己其它本不相关的论文以增加自身的被引量,或者期刊编辑偶尔会强迫投稿人在参考文献里增加很多自己期刊的论文引用。
引文影响力指标集(CitationImpact)是SciVal中最容易受人为影响的指标。
尽管自引的滥用十分少见,但是用户如果愿意的话,可以选择将自引从这些指标中排除出去(如表1所示)。
其他的指标受人为操控的影响相对要小的多,如科研产出与合作方面的指标。
3.2.6时间 时间跨度对于某些指标来说十分重要。
最明显的就是引文影响力(CitationImpact)指标集,因为出版物积累引用需要一定的时间。
h指数是另外一个例子,它对时间不敏感,如果用该指数评价处于研究生涯早期的青年研究者用处不大,因为这些青年研究人员需要时间以积累更多的科研成果以及引用。
一些与时间无关的指标可以在文献被收录于数据库时立即使用。
比如通过使用机构署名信息来探寻合作关系的那些指标。
甚至有一个引文影响力(CitationImpact)指标也与时间无关:高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)这一指标使用的是文献所在期刊的被引频次。
/research-intelligence/scival 27
4.SciVal指标:使用方法 本节介绍了SciVal提供的具体指标以及这些指标的计算方法、使用场景,并强调了使用中的注意事项。
我们建议选择多个指标相互配合使用,用于克服特定单一指标所带来的结果误差缺陷,或用于强调互为补充
的信息。
这些建议指标如表4所示;这些建议并非强制规定,只是使用指南,以帮助用户选择适当的指标。
对于指标... 科研产出(Scholarlyoutput) 期刊计数(JournalCount)期刊分类计数(JournalCategoryCount) 被引频次(CitationCount) 获得引用的文献数量(CitedPublication) 篇均被引频次(CitationperPublication) 施引文献覆盖国家计数(NumberofCitingCountries) 领域归一化影响力 (Field-WeightedCitationImpact,FWCI) 文献合作(Collaboration) 文献合作影响力(CollaborationImpact) 校企合作(Academic-CorporateCollaboration)校企合作影响力 (Academic-CorporateCollaborationImpact) 高被引文献量(OutputsinTopPercentiles) 高百分位期刊中的发文量(PublicationsinTopJournalPercentiles) h指数(h-indices) ...可配合使用的指标包括: 科研产出(Scholarly output) 期刊计数(JournalCount) 期刊分类计数(JournalCategoryCount) 被引频次(CitationCount) 获得引用的文献数量(CitedPublication) 篇均被引频次(CitationperPublication) 表4:指标配合使用建议 28 Elsevier科研管理解决方案|SciVal ...可配合使用的指标包括: 施引文献覆盖国家计数(Number ofCitingCountries) 学科归一化影响力(Field-WeightedCitationImpact,FWCI) 文献合作(Collaboration) 文献合作影响力(Collaboration Impact) 校企合作(Academic-CorporateCollaboration) 校企合作影响力(Academic-Corporate CollaborationImpact) 高被引文献量(OutputsinTopPercen- tiles) 高百分位期刊中的发文量 (PublicationsinTopJournal Percentiles) h指数(h-indices) “对体量敏感的指标”与时间累计无关的指标指标值高低的沟通信息天然互补的指标基于文献的真实表现,而不是其所在期刊的平均水平文献至少需要被引用1次才能被使用避免在近些年出现“引用缺失” /research-intelligence/scival 29 4.1SciVal中指标的展示 SciVal的指标完全按照计算结果显示。
有时用户可能倾向于使用多年平均值,以“抹平”趋势曲线的剧烈起伏,但是SciVal不提供这种“抹平”手法,以保证指标数据的透明性。
这就意味着SciVal的部分趋势线看起来“跌宕起伏”,特别是在遇到小型数据集(如单个研究者)指标计算情况。
当然,展示大型数据集的指标时,趋势线一般会比较平缓。
4.2指标:科研产出(Scholarlyoutput) SciVal中的科研产出(Scholarlyoutput)反映了分析对象的生产力,即该分析对象有多少论文被Scopus收录。
科研产出(Scholarlyoutput)是一个: •生产率指标;•雪球指标; •体量敏感指标。
指标可用于: •对比分析相似(近似规模和研究领域)分析对象的生产力,例如:有研究者数量相近的研究机构;有相近研究领域和职业生涯长度的研究者; •当指标值比较大时,可以在图表中突出展示分析对象较同行的学术表现更好;•提供透明的底层数据来建立SciVal指标的信任度;•以一种难以被人为操控的方式分析出版行为;•当关于一种新方法的文献或者青年学者刚出现时就可以发现其早期活动。
指标在以下场合需谨慎使用: •当规模体量有较大差异的分析对象相互比较时,比如国家与研究机构,大型合作网络与独立研究者,或者长期稳定的研究领域和小型新兴研究领域相比较时: -对比这类分析对象时,指标值的差异反映的可能是分析对象规模的差异而非生产力的差异; -建议用户仅仅在对比相似分析对象时使用该指标,或者使用“篇均被引频次”这类体量归一化的指标进行比较。
•具有不同学科领域布局的分析对象进行基准对比分析时, -不同领域的学术研究往往发文规律相差较大。
例如,生命科学领域占比较高的研究机构,往往发文频率较高,与同等规模的人文科学领域占比较高的研究机构相比可能有更高的科研产出; -在这种情况下,科研产出的不同更有可能反映学科特性的差异,而不能为生产力差异提供可靠数据; 30 Elsevier科研管理解决方案|SciVal -使用该指标来对比有着不同学科背景的分析对象时,应考虑到这些差异; -在比较多学科分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对象共有的领域,或者使用领域归一化的指标进行分析,如“高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)”。
•理解在Scopus收录范围中有文献缺失的小型分析对象的生产力: -小规模数据集合中单篇文献的缺失有可能对表观生产力的指标值产生显著的负面影响; -解决这一问题的唯一方法就是提高警惕。
建议用户将“科研产出(Scholarlyoutput)”指标用于对比大规模数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不会使比较结果失真。
可配合使用的指标包括: •被引频次(CitationCount):分析对象所有文献被引用次数的总和,它是对科研产出(Scholarlyoutput)指标的自然补充; •h指数(h-indices):综合了科研产出和被引频次的指标; •其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标的值随着分析对象规模变大而增加,具体包括:期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),被引频次(CitationCount),获得引用的文献数量(CitedPublication,“绝对数值”),施引文献覆盖国家计数(NumberofCitingCountries),文献合作(Collaboration,“绝对数值”),校企合作(Academic-CorporateCollaboration,“绝对数值”),高被引文献量(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他无时间相关性的指标集,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
参见示例
2。
4.3指标:期刊计数(JournalCount) SciVal指标中的期刊计数(JournalCount)反映一个分析对象的文献组合多样性,即这个分析对象的文献发表在多少种不同的Scopus期刊上。
期刊计数(JournalCount)是一个: •学科指标 •体量敏感指标 /research-intelligence/scival 31 该指标可用于: •对比小规模分析对象,比如研究者和文献集合,其期刊分布组合的差异最为明显; •当指标值相对较大时,可以在图表中突出展示一个相对较大的分析对象的表现; •对比分析相关分析对象文献组合的多样性,比如研究机构模拟探讨招收各类研究者的效果,或者在某些研究领域建立合作网络的效果; •展示分析对象的工作跨越传统学科的卓越性,并为投稿提供潜在的目标期刊; •提供透明的底层数据来建立SciVal指标的信任度; •以一种难以被人为操控的方式分析出版行为; •当关于一种新方法的文献或者青年学者刚出现时就可以发现其早期活动。
指标在以下场合需谨慎使用: •对比大型分析对象,比如研究机构和研究机构群组发表大量文章,并且文章所在期刊分布非常广泛,有可能达到Scopus数据库最大限度导致区别或许看上去并不明显。
建议用户在使用该指标时运用数据筛选选项,例如研究领域筛选(ResearchAreafilter),将比较范围缩小至大型分析对象的某些特定学科; •当规模体量有较大差异的分析对象相互比较时,如有150位学者的系和30位学者的系 -比较此类分析对象时,体量敏感指标值的不同反映的可能是分析对象规模的差异,而不是文献组合多样性的差异; -建议用户在对比同等规模分析对象时使用该指标,或者使用如“文献合作”这类体量归一化的指标进行比较。
•具有不同学科领域布局的分析对象进行基准对比分析时,处于不同学科领域的学者投稿的期刊范围可能大不相同: -在这种情况下期刊数量差异反映的可能是学科特点的差异,并不能为文献组合差异提供可靠信息; -使用该指标比较不同学科的分析对象时,应考虑这些差异; -比较多种学科组成的分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对象共有的领域,或者使用“学科归一化影响力(Field-WeightedCitationImpact)”等学科归一化的指标; •理解在Scopus覆盖范围内可能有缺失的小型分析对象的生产力:-小型数据集中单篇文献的缺失有可能对文献组合的广度有显著的负面影响; 32 Elsevier科研管理解决方案|SciVal -解决这一问题的唯一方法是提高警惕。
建议用户将“期刊计数(JournalCount)”指标用于对比大型数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不会使比较结果失真。
可用的辅助指标包括: •期刊分类计数(JournalCategoryCount):凸显分析对象的学科广度,是期刊计数(JournalCount)的自然补充; •其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标值随着分析对象规模增大而值增加:科研产出(Scholarlyoutput),期刊分类计数(JournalCategoryCount),被引频次(CitationCount),获得引用的文献数量(CitedPublication,“绝对数值”),施引文献覆盖国家计数(NumberofCitingCountries),文献合作(Collaboration,“绝对数值”),校企合作(Academic-CorporateCollaboration,“绝对数值”),高被引文献量(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他“无时间相关性指标”集合,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:期刊分类计数(JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
4.4指标:期刊分类计数(JournalCategoryCount) SciVal中期刊分类计数(JournalCategoryCount)反映分析对象学科组合的多样性,即分析对象文献发表在多少种不同的期刊类别中。
期刊分类计数(JournalCategoryCount)的计算结果既可以基于主类别生成也可以通过子类别生成。
其中Scopus期刊主分类有27种,子分类有334种。
SciVal中有2种方式对文献进行分类: •“期刊主导型”分类法,假设一篇文献的分类取决于这篇文献所在期刊的分类。
所有文献自动采用期刊对应的主题分类。
这种分类方法适用于集中于一个核心领域、一般不发表其他领域相关文献的期刊; •“文献主导型”分类法,假设期刊内的文献在期刊范畴的核心领域外有其他相关领域。
文献主导型分类法允许从期刊中另行分配个别文献到与其相关的分类中。
这对多学科期刊的文献有重要意义。
期刊分类计数(JournalCategoryCount)采用“文献主导型”分类法,一篇文献可以被分配到多种类别中。
期刊分类计数(JournalCategoryCount)是一个: •学科指标 •体量敏感指标 参见示例
2。
/research-intelligence/scival 33 该指标可用于:•对比小规模分析对象,比如研究者群组和文献集群组,其期刊分布组合的差异最为明显;•当指标值相对较大时,可以在图表中突出展示一个相对较大的分析对象的表现;•对比分析相关分析对象学科组合的多样性,比如由特定基金的同一经费资助的合作网络;•通过揭示分析对象的产出对不同学科读者的吸引力提供跨学科的证据;•提供透明的底层数据来建立SciVal指标的信任度;•以一种难以被人为操控的方式分析出版行为;•当关于一种新方法或者青年学者的文献刚出现时就可以发现其早期活动的不同。
指标在以下场合需谨慎使用 •对比大型的分析对象,比如研究机构和研究机构群组发表大量文章,并且文章所在期刊分布非常广泛,有可能达到Scopus数据库最大限度导致区别或许看上去并不明显。
建议用户在使用该指标时运用数据筛选选项,例如研究领域筛选(ResearchAreafilter),将比较范围缩小至大型分析对象的某些特定学科; •当规模体量有较大差异的分析对象相互比较时,如具有单一论文集合的大型合作网络: -比较此类分析对象时,体量敏感指标值的不同反映的可能是分析对象规模的差异,而不是文献组合多样性的差异 -建议用户在对比同等规模分析对象时使用该指标,或者使用如“校企合作”这类体量归一化的指标进行比较。
•对比分析独特学科分析对象的生产力,从事独特学科研究的学者在从事跨学科研究中可能有不同的行为方式: -在这种情况下,期刊分类计数的差异反映的可能是不同独特学科的特点,而不能为学科组合的差异提供可靠信息; -使用该指标对比不同独特学科的分析对象时,应考虑到这一差异; -当对比多学科分析对象(如机构或国家)时,建议用户通过筛选研究领域来聚焦于所有分析对象共有的一个领域,或者使用诸如高百分位期刊中的发文量等领域归一化的指标。
•理解在Scopus覆盖范围内可能有缺失的小型分析对象的生产力:-小型数据集中单篇文献的缺失有可能对文献组合的广度有显著的负面影响; -解决这一问题的唯一方法是提高警惕。
建议用户将“期刊计数(JournalCount)”指标用于对比大型数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不会使比较结果失真。
34 Elsevier科研管理解决方案|SciVal 可用的辅助指标包括: •期刊分类计数(JournalCategoryCount),突出分析对象的文献组合,也是对期刊分类计数(JournalCategoryCount)的自然补充; •其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标值随着分析对象规模增大而值增加:科研产出(Scholarlyoutput),期刊分类计数(JournalCategoryCount),被引频次(CitationCount),获得引用的文献数量(CitedPublication,“绝对数值”),施引文献覆盖国家计数(NumberofCitingCountries),文献合作(Collaboration,“绝对数值”),校企合作(Academic-CorporateCollaboration,“绝对数值”),的文献量(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他“无时间相关性指标”集合,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:科研产出(Scholarlyoutput),期刊计数(JournalCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
参见示例
2。
/research-intelligence/scival 35 示例2:科研产出(ScholarlyOutput),期刊计数(JournalCount)和期刊分类计数(JournalCategoryCount) 实例:用户需要计算分析对象的科研产出(ScholarlyOutput),期刊计数(JournalCount)和期刊分类计数(JournalCategoryCount),该分析对象有6篇文献,选择以下查看和计算选项。
选择时间范围选择文献类型选择研究领域 2008-2012Articles,reviewsandconferencepapers AgriculturalandBiologicalSciences 文献ID出版年文献的来源出版物文献类型 期刊子类别 文献是否符合用户选择的选项? 步骤
1 期刊主类别文献的期刊类别是否符合选择的研究领域? 有6篇文献的分析对象 文献12007BioscienceJournalArticle GeneralAgriculturalandBiologicalSciences AgriculturalandBiologicalSciences 文献
2 2009 BiologyandEnvironment Article AnimalScienceandZoology AquaticScience, AgriculturalandAgriculturalandBiologicalSciencesBiologicalSciences 是 是 是 步骤
2 文献是否符合选取的时间范围? 否 是 步骤
3 文献类别是否符合选择的文献类别? 是 是 步骤
4 文献是否通过步骤1,2和3? 否 是 问: 答:计算在步骤4中得到“是” 怎样计算科研产出?
的文献数量。
问:怎样计算期刊数量? 答:注意步骤4中得到的“是”的文献的唯一期刊标题。
–计算唯一期刊标题的数量 问:怎样计算期刊类别数量(主类别)? 答:查找主分类–去重 –计算唯一主分类的数量 问:怎样计算期刊类别数量(子类别)? 答:查看子分类–去重 –计算唯一子分类的数量 科研产出(ScholarlyOutput)=
3 对筛选后文献的期刊标题进行去重。
BiologyandEnvironment,ArchivfürLebensmittelhygiene 期刊数量(JournalCount)=
2 对通过筛选的文献的主类别名称进行去重AgriculturalandBiologicalSciences 期刊主分类计数(JournalMainCategoryCount)=
1 对通过筛选的文献的子类别进行去重。
AgronomyandCropScience,AnimalScienceandZoology,AquaticScience,Horticulture 期刊子分类计数(JournalSub-CategoryCount)=
4 36 Elsevier科研管理解决方案|SciVal 文献32009BiologyandEnvironmentArticleInPress InsectScience EnvironmentalChemistry AgriculturalandEnvironmental BiologicalSciences Science 有6篇文献的分析对象 文献42008BiologyandEnvironmentReview 文献52010 ArchivfürLebensmittelhygieneArticle 文献62010ArchivfürLebensmittelhygieneReport AgronomyandCropScience Horticulture OrganicChemistry AgriculturalandBiologicalSciences AgriculturalandBiologicalSciences Chemistry 是 否 是 是 是 否 是 否 是 是 否 是 是 是 否 是 否 /research-intelligence/scival 37 4.5
指标:被引频次(CitationCount) SciVal中被引频次(CitationCount)表示特定分析对象的总体引用影响力,即该分析对象的科研产出总共被引用的次数。
被引频次(CitationCount)是一个: •引文影响力指标;•雪球指标;•体量敏感指标。
SciVal通常情况下以图表来表现历年的被引频次,这些年份通常是文献的出版年份,而不是施引文献的引用年份。
指标可用于: •对比分析相似(近似规模和研究领域)分析对象的可见度,如研究人员数量相近的学科机构,或类似学科的国际合作网络;•当指标值比较大时,可以在图表中突出展示分析对象较同行的学术表现更好;•展示出某一分析对象发表了一些高被引文献;•提供透明的底层数据来建立SciVal指标的信任度。
指标在以下场合需谨慎使用: •当规模体量有较大差异的分析对象相互比较可见度时,“体量敏感指标”更确切地反映了分析对象大小而不是可见度差异,一组机构(如美国的一个州)的引用数量通常高于单个机构。
建议用户使用体量归一化影响力指标“篇均被引频次 (CitationperPublication)”或者学科归一化影响力指标(Field-CitationImpact)来分析不同大小实体间的可见度。
•具有不同学科领域布局的分析对象进行基准对比分析时:-例如,医学和病毒学学者的发表与引用频率都较高,而商学院或语言学学者的发表与引用频率则较低;-在没有说明差异时,该指标不适用于比较不同学科;-在比较多学科分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对象共 有的领域,或者使用领域归一化的指标进行分析。
•具有不同学科领域布局的分析对象进行基准对比分析时:-例如,医学和病毒学学者的发表与引用频率都较高,而商学院或语言学学者的发表与引用频率则较低;-在没有说明差异时,该指标不适用于比较不同学科; 38 Elsevier科研管理解决方案|SciVal -在比较多学科分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对象共有的领域,或者使用领域归一化的指标进行分析。
•研究某一分析对象的出版物被引信度,因为一篇或一些高被引文献有可能掩盖分析对象还有一些从未被引用的文献,建议用户选择被引文献数量(CitedPublications)来反映信度。
•小规模分析对象完整的科研产出与被Scopus收录的文献可能存在差异: -小规模数据集合中单篇文献的缺失有可能对分析对象的可见性带来显著的负面影响。
例如,如果某位学者发表的论文未被收录,或引用该出版物的文献未被收录,则该学者的学术表现评估会受到影响; -解决这个问题的唯一方法是提高警惕。
同时,若数据库引用缺失值较多,要考虑限制使用被引频次去对比相同学科数据集合;在指标不失效和数据缺失对所有实体产生效果较为接近的前提下可使用被引频次。
•有一种情况是过量的自引可能导致引用数量虚高。
用户可以通过取消勾选“包括自引(Includeselfcitations)”选项,判断出自引比率是否过高。
•了解文献在发表初期的影响力,或研究者尚处于职业早期时的成果表现,因为较新的文献发表时间尚未累计到足够的引用导致采用被引频次指标不可信。
建议用户在这种情况下,使用科研产出(ScholarlyOutput)或者文献合作(Collaboration)指标。
•人们在使用数据时,不希望见到近几年的“下滑”趋势曲线。
“下滑”曲线在被引频次里很常见,因为近期的新文献尚没有足够时间被人们引用。
鉴于此,建议用户使用学科归一化影响力指标(Field-WeightedCitationImpact)或高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
可配合使用的指标包括: •篇均被引频次(CitationsperPublication)和学科归一化影响力(Field-WeightedCitationImpact),为总体可见度融入补充视角,也在比较不同规模分析对象时表明差异性。
此外学科归一化影响力(Field-WeightedCitationImpact)还考虑了学科间出版和引用行为的差异; •学科归一化影响力(Field-WeightedCitationImpact)、高被引文献(OutputsinTopPercentiles)、高百分位期刊中的发文量(PublicationsinTopJournalPercentiles),可用于避免因文献发表时间较短、累计获得引用较少而导致引用数量在近年来出现“下降”趋势的问题; •被引文献数量(CitedPublications)用于测量一个分析对象的文献随后将被引用的可靠性,不会因一个或多个文献被高频引用而受到影响; •h指数(h-indices),它的价值在于将被引频次和科研产出(ScholarlyOutput)组合在一起,是自然的辅助指标; •其他“体量敏感指标集(PowerMetrics)”中的指标:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),被引文献数量(CitedPublication,“绝对数值”),引用国家数量(NumberofCitingCountries),文献合作(Collaboration,“绝对数值”), /research-intelligence/scival 39 校企合作(Academic-Corporate
Collaboration,“绝对数值”),高被引文献(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他“无时间相关性指标集合”,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
见例
3. 4.6指标:被引文献数量(CitedPublications) SciVal中的被引文献数量(CitedPublications)表示一组文献的被引情况:即该分析对象的文献中有多少篇文献至少被引用一次。
被引文献数量(CitedPublications)是一个: •引文影响力指标; •当“绝对数量(AbsoluteNumber)”选项被选中时是体量敏感指标,当“百分比(Percentage)”选项被选中时则不是。
SciVal中常以图表来表现历年的被引文献数量(CitedPublications),这些年份通常出版年份,而不是获得引用的年份。
指标可用于: •对比分析文献在多大程度上能够得到后续文献的引用; •比较规模不同、学科相近分析对象的文献影响力,例如大规模产出国家和小规模产出国家的比较,或者大规模研究团队和小规模研究团队的对比; -在比较不同规模分析对象时,建议勾选“百分比(Percentage)”选项来实现该变量的归一化。
•在不考虑被引频次的情况下,展示分析对象有能力产出可信赖的被引文献; •展现少数高被引论文对分析对象表现提升所施加的正面影响,高被引论文会显著影响文献集合的被引频次和篇均被引频次; •提供透明的底层数据来建立SciVal指标的信任度。
指标在以下场合需谨慎使用: •比较具有不同学科的分析对象所产出的文献,在多大程度上能够得到后续文献的引用; -例如,寄生虫学的研究团队与数学建模研究团队对比,前者因为其学科高频率的出版和引用行为,可能 40 Elsevier科研管理解决方案|SciVal 在从出版到被引用之间仅会经历一个短暂的间隔期,而后者间隔期相对更长;不建议用户在没有考虑学科
差异性的情况下,选择此指标进行对比分析; -比较由多个学科组成的分析对象时(如机构或国家),建议运用学科领域筛选(ResearchAreafilter)将分析对象集中于所有分析对象共有的学科领域; •了解分析对象文献的被引数量大小时,建议用户使用“被引频次(CitationCount)”或“篇均被引频次(CitationsperPublication)”来表示该信息; •小规模分析对象完整的科研产出与被Scopus收录的文献可能存在差异: -小规模数据集合中单篇文献的缺失有可能对分析对象的可见性带来显著的负面影响。
例如,如果某位学者发表的论文未被收录,或引用该出版物的文献未被收录,则该学者的学术表现评估会受到影响; -解决这个问题的唯一方法是提高警惕。
建议用户将“被引文献数量(CitedPublications)”指标用于对比相同学科领域的大规模数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不会使比较结果失真; •过量的自引可能导致引用数量虚高。
用户可以通过取消勾选“包括自引(Includeself-citations)”选项,判断出自引比率是否过高; •了解文献在发表初期的影响力,或研究者尚处于职业早期时的成果表现,因为较新的文献发表时间尚未累计到足够的引用导致被引频次指标不可信。
建议用户在这种情况下,使用“科研产出(ScholarlyOutput)”或者“文献合作(Collaboration)”指标。
可配合使用的指标包括: •被引频次(CitationCount)和篇均被引频次(CitationsperPublication),表明引用影响力的大小,一篇或几篇高被引文献会对此指标带来积极影响; •其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标的值随着分析对象规模变大而增加,具体包括:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),被引频次(CitationCount),引用国家数量(NumberofCitingCountries),文献合作 (Collaboration,“绝对数值”),校企合作(Academic-CorporateCollaboration,“绝对数值”),高被引文献(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的文献
9 (PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他“无时间相关性指标集合”,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数 (JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
见例
3. /research-intelligence/scival 41 4.7指标:篇均被引频次(CitationsperPublication) SciVal中的篇均被引频次(CitationsperPublication)表示特定分析对象的文献获得的平均引用影响力:即该分析对象的文献平均引用频次。
篇均被引频次(CitationsperPublication)是一个: •引文影响力指标•雪球指标 SciVal中常以图表来表现历年的篇均被引频次(CitationsperPublication),这些年份通常是出版年份,而不是获得引用的年份。
指标可用于: •对比分析不同文献集合的平均引文影响力; •比较规模不同、学科相近分析对象的文献平均影响力,如从事相似学科领域研究的研究团队,和相关研究人员间的比较; •展现少数高被引论文对分析对象的文献平均影响力提升所施加的正面影响;•提供透明的底层数据来建立SciVal指标的信任度。
指标在以下场合需谨慎使用: •比较拥有独特学科领域分析对象的文献平均影响力,如拥有大型人文科学类学院的机构和没有人文科学类学校的机构。
-在没有说明差异时,该指标不适用于比较不同学科; -比较由多个学科组成的分析对象(如机构或国家)时,建议运用学科领域筛选(ResearchAreafilter)将分析目标集中于所有分析对象的共有领域,或者选择“学科归一化影响力(Field-WeightedCitationImpact)”指标来衡量; •研究某一分析对象的文献被引信度,可能存在少量的高被引文献显著提升本指标的数值,而一定数量的零被引文献被忽略的情况。
建议用户选择“被引文献数量(CitedPublications)”来反映文献集合中被引用的数据量; •小规模分析对象完整的科研产出与被Scopus收录的文献可能存在差异: -小规模数据集合中单篇文献的缺失有可能对分析对象的可见性带来显著的负面影响。
例如,如果某位学者发表的论文未被收录,或引用该出版物的文献未被收录,则该学者的学术表现评估会受到影响; -解决这个问题的唯一方法是提高警惕。
建议用户将“篇均被引频次(CitationsperPublication)”指标用 42 Elsevier科研管理解决方案|SciVal 于对比同学科领域的大规模数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不
会使比较结果失真; •当分析对象科研产出规模过小,该指标会随着时间推移剧烈波动,即使在Scopus收录较完整的情况下也会产生此种现象。
“篇均被引频次(CitationsperPublication)”计算的是一个平均值,该值会显著受到小数据集影响; •过量的自引可能导致引用数量虚高。
用户可以通过取消勾选“包括自引(Includeself-citations)”选项,判断出自引比率是否过高; •了解文献在发表初期的影响力,或研究者尚处于职业早期时的成果表现,因为较新的文献发表时间尚未累计到足够的引用导致被引频次指标不可信。
建议用户在这种情况下,使用“期刊分类计数(JournalCategoryCount)”或者“文献合作(Collaboration)”指标; •人们在使用数据时,不希望见到近几年的“下滑”趋势曲线。
“下滑”曲线在被引频次里很常见,因为近期的新文献尚没有足够时间被人们引用。
鉴于此,建议用户使用“学科归一化影响力(Field-WeightedCitationImpact)”指标。
可配合使用的指标包括: •学科归一化影响力(Field-WeightedCitationImpact)指标是对文献平均影响力的自然补充,同时考虑了学科间的行为差异; •学科归一化影响力(Field-WeightedCitationImpact)、高被引文献(OutputsinTopPercentiles)和高百分位期刊中的发文量(PublicationsinTopJournalPercentiles),可用于避免因文献发表时间较短、获得引用较少而导致引用数量在近年来出现“下降”趋势的现象; •被引文献数量(CitedPublications)用于测量一个分析对象的文献随后将被引用的可靠性,不会一个或多个文献被高频引用而受到影响。
•合作影响力(CollaborationImpact)和校企合作影响力(Academic-CorporateCollaborationImpact)中有计算篇均被引频次的选项,它们是以具有合作性质的特定数据子集作为评价数据基础的。
•其他“无时间相关性指标集合”,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
见例
3. /research-intelligence/scival 43 例3:被引频次(CitationCount)、被引文献数量(CitedPublications)与篇均被引频次(CitationsperPublication 场景:用户需要计算某个分析对象的被引频次(CitationCount)、被引文献数量(CitedPublications)与篇均被引频次(CitationsperPublication),该分析对象包括6篇文献,用户选定了以下的查看和计算选项。
出版时间范围选择(SelectedPublicationYearrange) 出版文献类型选择(SelectedPublicationTypes) 学科领域选择(SelectedResearchArea) 2005-2013Articles,reviewsandeditorials Medicine 文献是否匹配用户选定的选项? 第1步 文献信息出版时间出版文献类型此文献总被引频次期刊二级分类期刊主类别 文献期刊类别是否与被选研究范围匹配? 第2步 文献是否在被选时间范围内出版? 第3步第4步 文献类型是否和被选文献类型匹配?文献跳过了第1,2,3步骤吗? 分析对象的6篇文献 文献12008Review
0 Anthropology 文献
2 2007 Editorial
4 EmergencyMedicine ManagementScienceandOperationsResearch SocialScience Medicine DecisionSciences 否 是 否 是 是 是 是 否 是 问题:如何计算学术产出?答:计算出在第4步中选择“是”的文献数量。
问题: 答:检索出第4步中选择“是”的文献引用数量。
如何计算被引频次? 科研产出(ScholarlyOutput)=
4 N/A
4 问题:如何计算被引文献数量? 问题:如何计算篇均被引频次? -第4步中选择是“是”的文献被引次数总和 被引频次(CitationCount)=15 答案:跳过第4步的文献是否被引至少一次? N/A 是 “绝对数量(Absolutenumber)”选项,算出至少被引一次文献的数量。
“百分比(Percentage)”选项,用上述“绝对数量(Absolutenumber)”除以“科研产出(ScholarlyOutput)”。
答案:用“被引频次(CitationCount)”除以“科研产出(ScholarlyOutput)” 被引文献数量(CitedPublications)=
3 被引文献数量=75% 篇均被引频次(CitationsperPublication)=3.8 44 Elsevier科研管理解决方案|SciVal Anatomy 文献32005Article
7 InformationSystemsandManagement Medicine DecisionSciences 实体的6篇文献 文献42004Article 9ImmunologyandAllergy Medicine 文献52008Article
0 GeneralMedicine Medicine 文献62010Article 4EmergencyMedicine Medicine 是 否 是 是 是 是 否 是 是 是 是 是 是 是 否 是 是
7 N/A
0 4 是 N/A 否 是 /research-intelligence/scival 45 4.8
指标:施引文献覆盖国家计数(NubmerofCitingCountries) SciVal中的施引文献覆盖国家计数(NubmerofCitingCountries)反映了分析对象文献的区域知名度,即有多少个国家已引用了该分析对象的文献。
施引文献覆盖国家计数(NubmerofCitingCountries)是一个: •引文影响力指标; •体量敏感指标。
SciVal通常情况下以图表来表示历年施引文献覆盖国家计数(NubmerofCitingCountries),年份指文献发表的年份而非被引用的年份。
指标可用于: •对比小规模分析对象,如研究组和文献集合,这时施引文献覆盖国家数量的差异会更明显;•当指标值相对较大时,可以在图表中突出展示一个相对较大的分析对象的表现;•对比分析相关分析对象文献组合的区域知名度,如: -特定研究领域内的合作网络;-研究领域相同、职业发展时长相似的研究人员;-研究机构进行情景模拟:雇佣不同研究人员可能带来的潜在影响力;•通过展现引文来源的区域多样性,证明作品有广泛的区域影响力;•提供透明的底层数据来建立SciVal指标的信任度;•以一种难以被人为操控的方式分析出版行为 指标在以下场合需谨慎使用: •比较大型分析对象,如机构和国家。
这些分析对象发表了大量的文献以至于获得的大量的引用,以至于施引文献覆盖国家计数值没有显著的区分度。
建议用户在使用该指标时运用数据筛选选项,例如研究领域筛选(ResearchAreafilter),将比较范围缩小至大型分析对象的某些特定学科。
•当规模体量有较大差异的分析对象相互比较时,如机构和院系进行比较,此体量相关指标值的不同反应的是分析对象规模不同,而不是区域可见性的区别。
不建议用户使用该指标来比较规模不同的•分析对象。
•对比分析不同学科分析对象的合作关系: -不同的学科,其文献的国际合作模式可能截然不同,例如民族文学与化学,或地方史与计算机科学;-若无法解释上述差异,那么不建议使用该指标来比较不同学科的分析对象;-比较多种学科组成的分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对 象共有的领域; •了解分析对象所拥有文献的被引数量大小时,建议用户使用期刊计数(JournalCount)或篇均被引频次 46 Elsevier科研管理解决方案|SciVal (CitationsperPublication)等来获取有关信息。
•分析对象规模较小,其文献产出数量与被Scopus收录的文献数量可能存在差异: -此时缺失一篇文献可能对其全球可视性的分析结果产生重大负面影响,当分析对象规模较大时,即使缺失一篇或少数文献分析结果也还是可接受的; -解决这一问题的唯一方法是提高警惕,尤其是分析年轻科研人员等小型分析对象时。
当比较相同学科的较大规模数据集时,这时数据库收录的差异对全部分析对象有相似的影响,此时施引文献覆盖国家计数(NubmerofCitingCountries)这一指标还是可信的。
•调查新策略实施的早期阶段或年轻科研人员的文献表现时,这时根据引用信息来做决定的可靠性将会下降。
这种情况下,建议用户使用期刊计数(JournalCount)或其他无时间相关性的指标。
可用的辅助指标包括: •被引频次(CitationCount)和篇均被引频次(CitationsperPublication),用来获取关于被引数量大小的信息 •文献合作(Collaboration),用于说明分析对象科研产出的合作程度,是对施引文献覆盖国家计数(NubmerofCitingCountries)指标的自然补充,后者提供了影响力的地理分布范围。
•其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标值随着分析对象规模增大而值增,包括:科研产出量(ScholarlyOutput)、期刊计数(JournalCount)、期刊分类计数(JournalCategoryCount)、被引频次(CitationCount)、获得引用的文献数量(CitedPublications,绝对数量)、文献合作(Collaboration,绝对数量)、校企合作(Academic-CorporateCollaboration,绝对数量)、高被引文献量(OutputsinTopPercentiles,绝对数量)、高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,绝对数量)和h指数(h-indices)。
•所有其他“无时间相关性指标”集合,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标,包括:科研产出量(ScholarlyOutput)、期刊计数(JournalCount)、期刊分类计数 (JournalCategoryCount)、文献合作(Collaboration)、校企合作(Academic-CorporateCollaboration)和高端期刊产出高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
/research-intelligence/scival 47 例4:施引文献覆盖国家计数(NubmerofCitingCountries) 实例:用户想要计算分析对象六篇文献的施引文献覆盖国家计数(NubmerofCitingCountries),这些文献分别被文献
A、B、
C、D、E和F所引用,合计6次。
施引文献A施引文献B施引文献C施引文献D施引文献E施引文献
F 文献1是 是是是 文献
2 分析对象的6篇文献 文献
3 文献
4 是 是是 文献5是是是 是 文献
6 是是是 实例:施引文献
A、B、
C、D、E和F有如下的署名信息: 被引文献 作者 机构 文献
A A2 I4 A1 I1 文献
B A3 I4 A3 I2 A1 I1 文献
C A1 I3 A2 I2 文献
D A1 I1 A4 I1 A1 I1 文献
E A3 I5 A5 I1 A1 I1 文献
F A3 I8 A2 I1 国家 C2 C1C2C1 C1C2C1 C1C1 C1C3C1 C1C4C1 问:我该怎样计算施引文献覆盖国家计数(NubmerofCitingCountries)?答:计算施引文献署名信息表中不同国家的数量 施引文献覆盖国家计数(NubmerofCitingCountries)=
4 48 Elsevier科研管理解决方案|SciVal 4.9指标:学科归一化影响力(Field-WeightedCitationImpact) SciVal中的学科归一化影响力(Field-WeightedCitationImpact)是指分析对象文献的被引频次与数据库中其他类似文献的平均被引频次的比较,即分析对象文献的被引频次与全球平均值的比值 •学科归一化影响力(Field-WeightedCitationImpact)为1.00是指分析对象文献的被引频次恰好与根据全球类似文献的平均被引频次相同;“全球”的归一化影响因子或Scopus数据库的归一化影响因子为1.00; •学科归一化影响力(Field-WeightedCitationImpact)大于1.00是指分析对象文献的被引频次多于根据全球类似文献的平均被引频次而得出的预期数量;例如,2.11意味着被引频次比全球平均值多111%; •学科归一化影响力(Field-WeightedCitationImpact)小于1.00是指分析对象文献的被引频次少于根据全球类似文献的平均被引频次而得出的预期数量;例如,0.87意味着被引频次比全球平均值少13%。
类似文献是指Scopus数据库中发表年份相同、文献类型相同、学科(如Scopus期刊分类)相同的文献:•SciVal中的文献根据以下两种分类系统进行划分: -“期刊分类”划分方式:假设某期刊的每个文献都属于同一学科,每篇文献自动划分到所在期刊所分配的学科分类。
这种划分方式适用于那些专注于核心领域的期刊,它们不刊载同属于其他领域的文献; -“文献级别的分类”划分方式:假设期刊刊载的文献可能与期刊所专注的核心领域无关,而与其他领域相关。
文献级别的分类划分方式可将期刊中的单篇文献划分为其它相关类别;这对那些多学科期刊中的文献至关重要; •学科归一化影响力(Field-WeightedCitationImpact)采用“文献级别的分类”划分方式; •文献按照子学科划分,并且可以划分到多个子学科中。
计算类似文献的预期被引频次时,多学科的文献不能重复加权,这点至关重要。
例如,如果文献P既属于寄生生物学又属于微生物学,计算P在其中一个子学科的影响力时,不可以重复计算影响力。
SciVal会根据文献所属的多个学科类别平均划分文献和被引频次;如文献P按照0.5篇寄生生物学文献和0.5篇微生物学文献计算,其被引数量也由两个子学科所平均。
学科归一化影响力(Field-WeightedCitationImpact)是一个: •引文影响力指标 •雪球指标 SciVal通常情况下以图表来表现历年学科归一化影响力(Field-WeightedCitationImpact),年份是指文献发表的年份而非被引用的年份,被引频次指文献发表当年及随后三年所累积获得的被引次数总和。
该指标可用于: •对比分析不同分析对象,无论其规模、学科、出版时间、及文献类型构成是怎样的,如: -一个研究机构和该机构内的各个院系部门(研究小组);-一个国家和该国的研究机构;-一个地理区域和该地区的各个国家; /research-intelligence/scival 49 •通过观察学科归一化影响力(Field-WeightedCitationImpact)高于或低于全球平均水平1.00的程度,可方便地了解分析对象文献引用影响力方面的声誉; •由于考虑了近期发表文献累计获得引用较低的情况,由此学科归一化影响力(Field-WeightedCitationImpact)避免了被引频次(CitationCount)和篇均被引频次(CitationsperPublication)指标中会出现的近几年趋势下滑的曲线; •在Scopus数据库中收录不够完全的学科中,了解分析对象文献的被引表现,因为数据库收录范围的差异对分析对象文献和类似文献都有同样的影响,因此学科归一化影响力(Field-WeightedCitationImpact)值不受Scopus数据收录范围的影响; •可以作为观察引用数据的默认指标,因为该指标考虑了到影响其他影响力指标的多个因素; •以一种难以被人为操控的方式分析出版行为。
指标在以下场合需谨慎使用: •当分析对象文献被引数量大小的信息对分析目标至关重要时;在这种情况下,建议用户使用被引频次(CitationCount)或篇均被引频次(CitationsperPublication)等指标; •向更喜欢看到高数值的人展示优异表现时;在这种情况下,被引频次(CitationCount)或篇均被引频次(CitationsperPublication)指标会更适合; •分析对象规模较小,导致指标会随着时间的推移剧烈波动状态不稳定时,虽然Scopus收录范围已经十分广泛、全面,但是学科归一化影响力(Field-WeightedCitationImpact)计算的是平均值,而小数据集中的无关文献仍会极大地影响计算结果; •需要建立对SciVal指标的信任;本指标的计算涉及了多项因素的归一化处理,另外计算类似似文献的平均被引频次需要遍历Scopus数据库所有的数据,导致用户对指标的计算很难进行验证。
如果用户需要建立对SciVal指标计算准确性的完全信任并实现可自行验证,那么建议用户选择更简单的影响力指标,如被引频次 (CitationCount)或篇均被引频次(CitationsperPublication); •研究新策略实施的早期阶段或年轻科研人员的文献表现,这时根据引用信息来做决定的可靠性将会下降。
这种情况下,建议用户使用无时间相关性的指标,如校企合作(Academic-CorporateCollaboration); •彻底回答所有与表现相关的问题,学科归一化影响力(Field-WeightedCitationImpact)是个非常有用的指标,但仅仅运用该指标而排除其他指标则会限制用户从SciVal中得到的丰富又可靠的信息。
可用的辅助指标包括: •被引频次(CitationCount)和篇均被引频次(CitationsperPublication),该两个指标反映了被引频次数量的大小,是学科归一化影响力(Field-WeightedCitationImpact)指标的自然补充。
另外,上述指标简单易懂,数据和计算过程透明,用户可以自行验证从而建立对SciVal指标计算的信任; •无时间性的指标,可以立即提供文献有用的可靠信息,而不依靠时间来累积有效信息,包括:科研产出 50 Elsevier科研管理解决方案|SciVal (Scholar
此手册将伴随SciVal产品的发展不断更新,我们也欢迎学术界的各位同仁对手册的翻译包括SciVal产品的使用提出宝贵意见,让这个年轻而富有活力的科研工具科研更好满足中国用户的需求。
意见反馈请发送至ISTIC-Elsevier联合实验室w.xie@,zhailh@。
Elsevier科研管理解决方案团队2018年4月于北京 2018 Elsevier科研管理解决方案 SciValSciVal指标手册 版本1.02|2018年4月 赋予知识力量 作者 LisaColledge博士和ReinderVerlinde博士 版本1.022018年4月
2 Elsevier科研管理解决方案|SciVal 目录 1.0 Scopus:SciVal指标的数据源
5 1.1 Scopus数据库介绍
5 1.1.1Scopus数据库内容和SciVal
5 1.1.2图书与SciVal
5 1.2 Scopus和SciVal的数据更新
5 1.3 学者档案
5 1.3.1Scopus的学者档案
6 1.3.2SciVal的作者和研究者
6 1.4 机构档案
7 1.4.1Scopus的机构档案
7 1.4.2SciVal的机构和科研机构
7 1.5 出版物的版权属于研究机构还是研究
8 人员? 1.6 机构类型
8 1.6.1Scopus的机构类型
8 1.6.2SciVal的机构类型
8 1.7 Scopus和SciVal的期刊指标
9 2.0 SciVal及其指标 10 2.1 SciVal评价指标 10 2.2 SciVal中的指标计算和显示 11 2.2.1
指标计算所涉及的文献 11 2.2.2去重 11 2.2.3零值和空值 12 2.2.4“>当前年”的情况 12 2.2.5被引频次 12 2.2.6计算选项 13 2.2.6.1学科领域筛选 15 2.2.6.2出版社类型筛选 15 2.2.6.3排除自引 16 2.2.6.4绝对数量和百分比选项 16 示例1a:自引的排除 17 示例1b:自引的排除 18 3.0 指标的合理选择 20 3.1 明确问题 20 3.2 除了学术表现,其他影响指标值的因素20 3.2.1规模 21 3.2.2学科 21 3.2.3出版物类型 24 3.2.4数据库收录范围 25 3.2.5人为操控 27 3.2.6时间 27 4.0 SciVal指标:使用方法 28 4.1 SciVal中的指标展示 30 4.2 指标:科研产出 30 4.3 指标:期刊计数 31 4.4 指标:期刊分类计数 33 示例2:
科研产出,期刊计数和期刊分类计数36 4.5 指标:被引频次 38 4.6 指标:被引文献数量 40 4.7 指标:篇均被引 42 示例3:被引频次,获得引用的文献计数, 篇均被引频次 44 4.8 指标:施引文献覆盖国家计数 46 示例4:施引文献覆盖国家计数 48 4.9 指标:学科归一化影响力 49 示例5:学科归一化影响力 52 4.10 指标:文献合作 53 4.11 指标:文献合作影响力 55 4.12 指标:校企合作 56 4.13 指标:校企合作影响力 58 示例6:
文献合作,文献合作影响力,校企合 作和校企合作影响力 60 4.14 指标:高被引文献量 62 示例7:高被引文献量 66 4.15 指标:高百分位期刊中的发文量 68 示例8:高百分位期刊中的发文量 72 4.16 指标:h指数组 74 示例9:h指数组 78 /research-intelligence/scival
3 前言 人们经常认为这段话出自艾伯特·爱因斯坦,但实际上应出自威廉·布鲁斯·卡梅隆
1,它经常出现在前言中,
那就是:“有价值的东西不一定被计量,已计量的东西不一定有价值。
” 这段话无疑是正确的,但并不是说一切都不应被计量。
许多事物是可计量的这点非常重要,能够为科研趋势提供宝贵见地,在今天的科研界,这一点日趋重要。
工程师们知道如何以正确且负责的方式使用他人开发的技术,车主们每天都在使用他们的专业成果。
车主欢迎工程师为他们的汽车不断做出贡献,因为这会使他们的生活更为轻松。
同样的,计量学指标领域的发展也依赖计量学专业的学术研究和技术进步;越来越多的科研人员正在将这些计量学的学术成果直接或间接地应用于科学研究中。
大多数人都不会认为自己是计量学专家:本手册就以这些人为对象,旨在帮助他们正确地理解和使用计量学指标。
本手册不是一本提供计量学指标最新进展的详细学术专著,而是一本SciVal(爱思唯尔科研管理工具的组成部分)的实用工具书。
随着SciVal的产品发展,本手册也将不断更新。
本手册介绍了指标计算所需的底层数据、指标是如何被计算及展示的,以及非绩效变量(variablesbesidesperformance)如何影响指标值。
本手册还就指标的使用领域、注意事项以及如何解决缺陷问题提出了建议。
在本手册中只有一种绝对正确的指标使用方法,那就是:考虑问题时始终使用一种以上的指标,并通过同行评议和/或专家意见支持自己的结论。
如果不同类型的信息能够为彼此提供支持,那么这种“三角化”策略将有助于提高结论的可靠性;如果信息并未彼此验证,则表明这个领域仍有待进一步研究。
除此之外,再无其他非黑即白的规则。
最好的使用策略就是运用常识。
希望您觉得本手册不但有用,而且有趣。
LisaColledge博士Elsevier 2014年1月 1:/2010/05/26/everything-counts-einstein/
4 Elsevier科研管理解决方案|SciVal
1.Scopus:SciVal指标的数据源 编写本手册期间,SciVal显示的所有指标与信息均以Scopus为基础。
本节重点介绍Scopus的部分内容,有助于帮助用户理解SciVal指标,读者还可以从Scopus在线指南里2更多内容 1.1Scopus数据库介绍 Scopus拥有一个国际化的内容遴选委员会,始终独立负责Scopus内容评审和收录有关评审流程和遴选标准的信息可在网上公开查询到
3。
委员会评审的内容包括期刊、会议文集、商业杂志、丛书及单行本图书。
Scopus收录了约五千万种出版物。
参考文献列表涉及来自1996年之后发表的2900万条记录以及可追溯至
1823年的2100万条1996年之前的记录。
1.1.1Scopus数据库内容与SciVal SciVal使用Scopus数据库1996年之后的内容,以确保在SciVal里展现的被引频次是以连续年份数据为基础的。
1.1.2图书与SciVal Scopus收录的图书包括丛书和单行本图书。
“图书”在SciVal中仅指那些单行本图书;由于不具有期刊指标的特点,它们的性质有别于与丛书、期刊、会议文集和商业杂志。
在作者提供的信息允许的情况下,Scopus会将引用内容链接到图书具体章节或图书本身。
Scopus会选择建立一种链接方式而不会同时建立两种。
为显示具体章节作者的被引频次,SciVal记录链接至该章节的引用数量;为显示整部著作作者的被引频次,SciVal记录链接至该著作的引用数量加上链接至所有章节的引用数量,以确保作者获得其学术贡献产生的完整引用影响力。
1.2Scopus与SciVal的数据更新 Scopus数据库内容是每天更新的。
SciVal数据库内容是每周更新的。
SciVal采用Scopus数据,然后对其进行结构化处理,以优化其对SciVal
指标与功能的支持。
这也是SciVal数据的更新程度可能略微滞后于Scopus的原因。
1.3学者档案 1.3.1Scopus学者档案 Scopus是全球唯一对收录论文按照作者进行自动分组的数据库。
Scopus将同一位作者的所有著作归集于同一个作者标识符(即学者档案)。
学者档案有两种论文统计模式: •采用匹配算法将论文自动归入学者档案: 2:/online-tools/scopus3:/online-tools/scopus/content-overview /research-intelligence/scival
5 -此算法寻找作者姓名、归属机构、期刊组合以及学科类别的相似之处,据此对论文进行归类。
用户可能会注意到,多个姓名变体归在同一学者档案下,这也是算法的价值所在。
-作者提供的信息并不总是统一或完整的,即使统一而完整,作者也具有流动性,因此我们无法确定某些论文是否同属一位作者。
在这种情况下,我们必须在匹配准确度(或精度)与覆盖度(或完整性)之间达到平衡,提高一方就会降低另一方。
-Scopus算法更偏向于准确度,只在匹配可信度至少达到99%时才会将论文归属为该作者,也就是说,在100篇论文中,99篇将得到正确归类。
在这种准确度下,数据库的覆盖度将达到95%,也就是说,如果一位作者发表了100篇论文,Scopus会将平均95篇归属到该作者。
-以上准确度与覆盖度适用于整个Scopus数据库。
在有些情况下,大量相似姓名会加剧学者档案间论文的分散性,如众所周知的中国作者姓名。
同样的,作者姓名区别度越高,论文分散性越低,如西方国家作者。
-具有多位作者的论文将被归于多个学者档案下。
•根据反馈对论文进行手工分类。
自动匹配算法永远达不到100%准确,因为算法使用的数据不会100%完整统
一。
因此,Scopus通过使用来自行业机构的反馈主动对算法进行补充,包括开放研究者(OpenResearcher)与贡献者身份识别码(OpenResearcherandContributorID(ORCID))的反馈
4,以及来自Scopus作者反馈团队用于改进学者档案的反馈
5。
1.3.2SciVal的作者和研究者 Scopus提供的学者档案为SciVal用户提供了极大灵活性。
SciVal用户可以使用学者档案实时定义及查看全球任何研究者,无论这些作者与用户同属一所机构、或是用户在另一个国家的合作伙伴,还是与用户素昧平生的陌生人。
用户可以在其SciVal账户中定义任何数量的研究者,然后以这些研究者为基础,创造出任意数量的: •学者群组。
可以代表真实的研究团队、部门或其他组织团队、国际合作网络,或正在考虑组建的研究团队模型。
•文献集合。
包含研究者的产出,如来自同一特定归属机构的论文,或由某种奖项资助的论文。
•文献集合群组。
包含提交给国家奖项评审的文献集合,如英国的ResearchExcellenceFramework6。
SciVal中的“作者”(authors)和“研究者“(Researchers)具有不同含义: •作者是指自动创建的Scopus“学者档案”。
例如,“概况”(Overview)模块中的作者数量是指独立学档案的数量;这个数量也可能高于研究者数量,因为覆盖度为95%,意味着同一位研究者的论文可能被归于不同学者档案下。
•研究者是指人工输入的实体。
SciVal用户可以合并学者档案,删除不属于该学者档案的文章,还可检索应 4:/5:/6:http://www.ref.ac.uk/
6 Elsevier科研管理解决方案|SciVal 加入该学者档案的具体论文。
供机构使用的“档案改进服务”(ProfileRefinementService)用于建立SciVal研究者与研究者群组,该服务也采用类似的人工流程,由爱思唯尔为客户完成。
SciVal区分人工创建的“研究者”(由用户或爱思唯尔创建)与自动创建的“学者档案”。
所有人工改进会反馈给Scopus,被用于提高源数据库的质量,供全体Scopus数据用户使用。
这就意味着Scopus处理反馈后,SciVal的研究者将拥有唯一学者档案,该信息可以在新论文收入索引后自动更新。
1.4机构档案 1.4.1Scopus机构档案 Scopus是全球唯一对收录论文按单一归属机构进行自动分组的数据库。
这些隶属于同一机构的文献群组被称为机构档案,共有两种输入模式: •采用匹配算法将论文自动归入机构档案: -此算法寻找机构名称以及地址的相似之处,对论文进行归类。
用户可能会注意到,多个名称变体被归入同一机构档案下,这也是算法的价值所在。
为了对论文进行分类,Scoups使用权威数据库,该数据库含有七万多条经过人工校正的机构名称变体。
-作者提供的机构信息并不总是统一或完整的,因此我们始终无法确定某些文章是否同属一组。
在这种情况下,我们必须在匹配准确度(或精度)与覆盖度(或完整性)之间达到平衡,否则提高一方就会降低另一方。
-Scopus算法更偏向于准确度,只有在匹配可信度至少达到99%时才会将论文归为一组,也就是说,在100篇论文中,99篇将得到正确归类。
在这种准确度下,数据库的覆盖度将达到93%,也就是说,如果一个机构发表了100篇论文,平均来说Scopus会将93篇论文归于一组,而其他论文则可能被归于一个或多个组。
-具有多位作者,且作者属于多个机构的论文将被归于多个机构档案下。
•根据反馈对论文进行手工分类。
匹配算法永远达不到100%正确,因为算法使用的数据并非100%完整或统一的。
因此,Scopus使用相关机构的官方权威反馈意见对算法补充。
1.4.2SciVal的里的机构和科研机构 Scopus提供机构档案,为SciVal用户带来了极大便利:用户只需轻点鼠标,即可获得预先计算好的指标。
SciVal还可使用“科研机构群组”(GroupsofInstitutions)功能,如按照美国各州组成的科研机构群组。
SciVal区分“机构”(affiliations)与“科研机构”(institutions)这两个术语: •机构是指自动创建的Scopus机构档案。
例如,医学院可以有一个是独立于大学之外机构档案。
•科研机构是指一组互有关联的机构档案,由人工创建,作为用户使用SciVal的便利起点;目前SciVal已经定义了约4,500家机构供用户使用。
任何一个医学院总是和其所属大学在SciVal里的科研机构分组在一起。
/research-intelligence/scival
7 1.5出版物的版权属于机构还是研究人员? 研究人员是可流动的,很有可能在其职业生涯中更换所属机构。
这就提供了论文“属于”机构还是研究人员的两种视角: •“机构视角”通常认为,即使作者已经调离机构,其发表的论文仍然应属于该机构。
换句话说,虽然作者已经调走,但论文不具移动性。
•“研究人员视角”通常认为,论文应和其作者一样具有移动性,应随着作者的职业发展而不断改变归属机构。
•人们需要在不同情况下使用不同视角回答不同问题。
SciVal同时提供这两种视角,因为论文同时与机构档案和学者档案建立联系,而机构档案和学者档案又互相独立: •SciVal中的机构与机构群组采用“机构视角”•SciVal中的研究研究人员、研究人员群组、文献集合与文献集合群组采用“研究人员视角” 1.6机构类型1.6.1Scopus的机构类型 Scopus根据机构的主要功能为机构档案分配机构类型。
机构的主要功能一般可以从机构的名称上了解,也可通过机构的网站进行确认。
Scopus为机构分配以下机构类型:大学、学院、医学院、医院、研究所、公司、法律事务所、政府、军事组织、非政府组织。
1.6.2SciVal的机构类型 SciVal将功能相似的Scopus机构类型合并在一起以简化用户操作。
在SciVal里面,一共有以下五种机构类型:学术机构、公司、政府机构、医疗机构及其他机构。
这五种机构类型分别包括以下不同的Scopus机构类型:•学术机构:大学、学院、医学院和研究所•公司:公司与法律事务所•政府机构:政府与军事组织•医疗机构:医院•其他机构:非政府组织
8 Elsevier科研管理解决方案|SciVal 1.7Scopus和SciVal的期刊指标 Scopus和SciVal采用两种期刊指标。
这两种指标由学术研究团队开发,指标的计算方法已经发表在同行评议期刊上。
这两种指标的信息可在网上查看到,所有指标值均可免费获取
7,这两种指标是: •SNIP8。
篇均来源期刊归一化影响力指数(Source-NormalizedImpactperPaper)是“单篇论文原始影响力”(RawImpactperPaper,即期刊实际收到的单篇论文引用量)与“引用潜力”(CitationPotential,即单篇文章在该期刊领域内预期引用量)之间的比值。
SNIP考虑到了不同学科的特点,可用于比较不同领域的期刊。
Scopus中所有期刊的SNIP指标的全球均值为
1。
•SJR9。
SCImago期刊排名(SCImagoJournalRank)是一个基于声誉的指标,其算法与谷歌PageRank类似。
这种指标根据引用论文所在期刊的领域、质量与声誉来计算引用文献的引用权重评估引用值,因此“每篇引用文献的引用权重值都是不相等”。
SJR还考虑到了不同学科学术行为的区别,可用于比较不同领域的期刊。
Scopus所有期刊的平均SJR值为1.000。
期刊指标不适用于行业杂志。
因为SNIP和SJR值的计算是以学术期刊为基础的,所以单行本图书也没有SNIP和SJR值。
7:8:/science/article/pii/S99:/science/article/pii/S6 /research-intelligence/scival
9 2.SciVal与计量指标 2.1SciVal中的计量指标 SciVal提供范围广泛的指标:•可灵活定制分析范围,从多角度诠释问题以适应不同用户的偏好;•可确保用户能够交叉验证结论的“有效性”。
在基于实证寻找问题的合理解释时,我们建议您至少选择两个计量指标来获取分析结果,如果这些结果能够相互加强印证结论,那么用户就可以更加确信结论是有效的; SciVal提供的指标共分为6组,一个指标可能被会被分在多个组别中,如表1所示:•科研效率指标集(ProductivityMetrics):提供一个实体科研产出数量的相关信息;•引用影响力指标集(CitationImpactMetrics):基于多种类型的被引频次计算,获取一个实体科研产出的影响力信息;•科研合作指标集(CollaborationMetrics):提供一个实体科研合作的信息;•学科指标集(DisciplinarityMetrics):提供一个实体科研产出基于学科的分析信息;•雪球指标集(SnowballMetrics)10:该指标集由知名研究密集型大学定义并背书,主要在机构发展战略分析方面用于获取深入的洞察力:-这些被认可且经过测试的指标定义在免费共享的“雪球指标集应用手册”11中可以找到;雪球指标集正致力于成为高等教育领域的全球化标准; -这些指标可被任何人按照自己的目的所应用。
爱思维尔公司支持雪球指标集成为公认的行业标准,并在相关的系统和分析工具中实现了这些指标,其中就包括了SciVal平台; -雪球(Snowball)指标在SciVal的使用界面中采用雪花标志标识,如图所示; •与“体量”成正相关指标集(Powermetrics):这组指标的值随着对应实体规模的增大而增大。
例如:大机构与小机构相比因为规模大,因此通常情况下会有更多的科研产出。
10:11:/metrics 10 Elsevier科研管理解决方案|SciVal 科研产出(ScholarlyOutput)期刊数量(JournalCount)期刊学科分类数量(JournalCategoryCount)被引频次(CitationCount)被引文献数量(CitedPublication)篇均被引频次(CitationperPublication)引用国家数量(NumberofCitingCountries)归一化影响因子(Field-WeightedCitationImpact,FWCI)合作(Collaboration)合作影响力(CollaborationImpact)校企合作(Academic-CorporateCollaboration)校企合作影响力(Academic-CorporateCollaborationImpact)高被引文献(OutputsinTopPercentiles)高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)h指数(h-index) 生产率 引用影响力科研合作 学科指标 雪球指标“体量”指标 表1:SciVal中的计量指标集。
其中与“体量”成正相关指标集(Powermetric)列中半阴影格对应的指标只有选中“绝对数值”选项时,才是一个“体量”指标(Powermetric);否则,如果选中“百分比”选项,则不是“体量”指标(Powermetric)。
2.2SciVal中计量指标的计算与展示 2.2.1计量指标计算所涉及的文献 理想的状况下,每篇文献的信息是充分完整的,那么计算每个指标时所有计算范围的文献都应该被计算在内。
但是实际情况并非如此,比如:文献作者有时未提供完整的机构署名信息,某些文献由于所在期刊刚被Scopus收录,导致没有对应的期刊计量指标……如果文献缺乏必要的信息就会被排除在指标计算之外。
2.2.2去重 SciVal允许用户将多个较小的实体聚合为一个实体进行研究。
例如:美国各个州由其各自涵盖的研究机构实体聚合而成,国家实体由多个地理区域实体聚合而成。
同一篇文献可能属于多个小的实体,并可能被多次添加到聚合实体中。
例如,作者R1与作者R2合作发表了文献P1,此时,P1既属于R1也属于R2。
如果R1和R2同属于一个研究组织,针对此研究组织进行计量分析时,会出现P1出现两次的情况。
SciVal的去重功能使一篇文献即使由多个作者合作完成,在聚合实体中也只被计为一篇文献。
一个实体(聚合实体)所涵盖的所有文献都是唯
一、不重复的,因此用户在创建聚合实体时,可以确认相关的文献集合已经是SciVal去重后的结果。
在上述案例中,P1在R1和R2组合而成的实体中只会被计为1篇文章。
/research-intelligence/scival 11 2.2.3零值和空值(Null) SciVal的指标解释中,零值和空值(没有数值)具有不同的含义。
比如科研产出(ScholarlyOutput)这个指标,要计算一个实体的文献产出数量。
如果该实体在统计时间段内没有文献产出,则科研产出指标显示为零。
缺少发文对理解实体的学术活动是非常重要的,因此学术产出这个指标绝不会出现空值。
而被引频次(CitationCount)这个指标就不是这种情况,被引频次计算实体的文献被引用的次数。
在统计时间段内,如果实体没有发表文献,那么显示它的被引频次为零是没有意义的。
没有发文自然不能得到引用,这与实体有文献发表,却没有得到任何引用是不同的。
因此,SciVal对以下两种情况进行了区分: •如果一个实体在统计的时间段内有文献发表,但是没有得到任何引用,那么被引频次(CitationCount)就显示为零值。
•如果一个实体在统计的时间段内没有文献发表,那么这个实体就不能在该时间段内得到任何引用。
在这种情况下,被引频次就显示为空值(Null)。
例如,用户可能会注意到在标杆分析(Benchmarking)模块中如果按时间查看指标时,由于有空值出现,曲线会出现小段缺失。
同样的处理原则也适用于其他指标。
例如:如果没有文献发表,也就不会存在国际合作。
高被引文献(OutputsinTopPercentiles)这一指标在计算当年的数值时,只能在当年7月1日之后才被计算出来。
在此之前,当年的指标将显示为空值。
最主要的原因是文献的被引频次具有时间累积性,当年发表的文献由于刚刚发布,还没有累积足够的被引频次,此时文献按被引频次高低的百分比划分,无法划分。
2.2.4“>currentyear”的情况 Scopus收录的内容很大一部分是期刊。
出版商有时会将期刊的某些卷期在它们尚未正式以纸媒方式出版前就在线发布出来。
例如,2013年底,用户在Scopus数据库就可以看到某些出版年份为2014年的,甚至更晚年份的文献。
SciVal极为重视数据的及时性,在这种情况下,数据中所有的信息都会呈现给用户。
所有早于未来纸媒出版日期,提前在线发表的文献,出版年被表示为“>current。
比如在2013年会出现“>2013”,在2014年会出现“>2014”,等等。
2.2.5被引频次(Citationcounts) SciVal中的被引频次是指文献发表以来截止到统计日期获得的总被引次数。
引文影响力指标(CitationImpact)指标在SciVal中往往用按年份统计的图或表显示,以此来表明其趋势。
统计的起始年份指的是文献发表的年度,而不是文献被引用的年度。
较早发表的文献往往比新发表文献的被引频次高,这是因为前者有更长的时间被后续研究所引用。
对于被引频次(CitationCount)和篇均被引频次(CitationsperPublication)这样的指标,计算过程中没有考虑时间累计的影 12 Elsevier科研管理解决方案|SciVal 响,用户往往会注意到指标曲线在最近几年的表现为“下降”趋势。
尽管有“下降”趋势的存在,相似实体之间的指
标比较仍然是有意义的。
这是因为时间累计因素对所有实体的影响均相同。
如果用户想避免这种现象,他们可以选择归一化影响因子(Field-WeightedCitationImpact)这类计算过程中考虑了时间累计因素的指标。
2.2.6计算选项 SciVal用户在使用计量指标方面会有不同的需求。
有些需求用可视化数据的方式就可以满足(如趋势信息),但是有些需求需要改变计量算法。
例如: •一位学者,如果他是学术期刊的编辑,通常需要发表社论(Editorials)。
这些社论会增加他科研产出指标的值,相应的引用影响力指标也会增加。
在理解这位学者的影响力时,把他所有的科研产出看作一体,包括社论,进行影响力分析是公允的。
因为作为学术期刊的编辑,撰写社论同样是他们对学术做出贡献的重要组成部分。
然而,如果把这位学者同那些不是期刊编辑的学者进行比较时,排除掉那些社论及其所产生的引用或许更加公平。
•自引是指作者在新发表的文献中引用自己以前的研究成果。
自引通常是正常的学术行为,作者有责任确保读者能够注意到与其研究成果相关的其他工作。
然而,一些用户在进行文献计量分析时更希望在计算引用相关指标时排除掉著者自引的情况,尽管这对于另外一些用户来说或许并不重要。
这些计算偏好没有绝对的正确或错误之分。
虽然在某些情况下,一个选项可能会变得非常重要。
在SciVal中会提供相关选项,使得用户可以自己选择这些计算参数。
每个指标都有自己的一组计算可选项,相关可选项汇总在表2中。
/research-intelligence/scival 13 Scival默认 研究领域筛选 (SubjectAreafilter) 文献类型筛选(Publicationtypefilter) 排除自引(Self-citationexclusion) 绝对数值或百分数(Absolutecountorpercentage) 无筛选 无筛选 未排除 百分数 科研产出(ScholarlyOutput) 期刊数量(JournalCount) 期刊学科分类数量(JournalCategoryCount) 被引频次(CitationCount) 被引文献数量(CitationPublications) 篇均被引频次(CitationsperPublication) 引用国家数量(NumberofCitingCountries) 归一化影响因子(Field-WeightedCitationImpact) 合作(Collaboration) 合作影响力(CollaborationImpact) 校企合作(Academic-CorporateCollaboration) 校企合作影响力(Academic-CorporateCollaborationImpact) 高被引文献(OutputsinTopPercentiles) 高百分位期刊中的发文量(PublicationsinTopJournalPercentiles) h指数(h-index) 学科主分类合作 校企合作百分位 或子类(Colla(Academic-(Percentile (Mainor boration)Corporatelevel) Sub-Category) Collaboration) 期刊指标(Journal Metric) 数据范围(Data Universe) 主分类 国际合作 包含此类合作 10% SNIP 全球 表2:SciVal相关指标的计算可选项 14 Elsevier科研管理解决方案|SciVal 2.2.6.1研究领域筛选(ResearchAreafilter) 研究领域筛选将一个实体涉及的文章限定在特定的学科领域,基于限定后的文章计算相关指标。
如果采用期刊分类作为研究领域分类依据,如所附界面截图所示,期刊的主分类及其子类均可作为研究领域进行筛选。
用户自定义的研究领域也可以在某些模块中作为筛选依据,如截图中的研究领域“石墨烯(Graphene)”和“疟疾(Malaria)”,即为用户自定义的研究领域。
研究领域筛选(ResearchAreafilter)仅用于限定所选实体涉及的文献。
它不会滤除文献获得的引用,进而影响引文影响力(CitationImpact)系列指标的计算。
即计算被引频次时不会考虑施引文献的研究领域。
有些指标并没有经过领域归一化处理。
由于不同学科领域具有不同的发文和引用规律,未归一化处理意味着学科的差异性在指标计算过程中未被考虑。
因此在进行非归一化指标值对比时,用户往往难以区分值的差异是来源学科的不同,还是实体表现的不同。
当然在相同的学科中进行比较时,这些非领域归一化的指标是非常有用的。
对于非归一化处理的计量指标比较,同一领域内相比才有意义。
用户在实际使用非归一化指标值时可以: •使用研究领域过滤器当选定一个非归一化的指标来比较涉及多个研究领域的实体(如机构或国家)时,利用研究领域筛选,使得这些实体在选定的研究领域具有可比性。
•使用领域归一化指标如归一化影响因子(Field-WeightedCitationImpact),该指标计算过程中对学科进行了归一化处理,消除了学科领域差异性。
SciVal的默认设置是无研究领域筛选。
2.2.6.2出版物类型筛选(Publication-typefilter) 出版物类型筛选用于限定文献类型,如:学术论文、评论、书籍等。
当用户在分析时判断区分文献类型对分析结果很重要时,可以应用该筛选功能,例如: •区分原创性研究论文(articles)和领域专家撰写的综述文章(reviews); •在工程和计算机领域中,有时会更加关注会议论文(conferenceproceedings); •在比较作为期刊编辑的学者和普通学者时,前者有机会发表社论(editorials)。
出版物类型筛选(Publication-typefilter),仅用于限定所选实体涉及的文献。
该筛选功能不会滤除文献得到的引用,进而影响引文影响力(CitationImpact)系列指标的计算,计算被引频次时不会考虑施引文献的出版物类型。
唯一的例外是高被引文献(OutputsinTopPercentiles),使用该筛选功能会限定用于产生引证阈值的数据。
SciVal的默认设置是无出版物类型筛选。
/research-intelligence/scival 15 2.2.6.3排除自引(Self-citationexclusion) 自引是指一个实体在新发表的文献中引用自己以前的研究成果。
自引通常被认为是对个人学术活动的连贯性梳理,期刊自引,机构自引,国家或地区自引是相同的活动在不同层次的表现。
自引行为没有本质上的错误。
这是正常的和预期会发生的学术行为,新的科研成果根植于过往的工作和论文成果;在新的成果中提醒读者关注过往重要的和相关的成果,可以帮助读者深入理解新成果。
事实上,与新成果文献最为相关并且需要关注的文献可能就是同一实体过往发表的文献,让读者注意到作者先前已发表的最相关的文献,也是作者的责任。
自引也可能被滥用。
虽然极为罕见,但一些违反学术道德的自引导致了自引行为有些蒙羞。
在进行引用影响力指标集分析时,SciVa为用户提供“排除自引(Self-citationexclusion)”的选项,用户可以自行判断一个实体的自引率是否在正常范围内。
SciVal可以区分作者、机构、国家或地区层面的自引,并依赖所分析实体的类型施加合理的排除,不需要用户特别干预。
SciVal的默认设置是不排除自引。
实例1a和1b展示了SciVal如何界定和排除自引。
2.2.6.4绝对数(AbsoluteNumber)和百分比选项(Percentage) SciVal中一些指标集的数值的计算提供两种选项:“绝对数值(AbsoluteNumber)”或“百分比(Percentage)”: •当比较不同规模的实体时,建议用户选择“百分比(Percentage)”选项,以达到规模归一化的目的; •当涉及出版物数量量级时,建议选择“绝对数值(Absolutenumber)”选项。
SciVal的默认设置为“百分比”。
16 Elsevier科研管理解决方案|SciVal 实例1a:自引的排除 案例描述:用户想要考察一个实体,可能是国家、研究机构或者研究者,这个实体由1篇文献(PP)构
成,共获得6次引用,分别来自文献P1、P2、P4、P5、P6、P7。
文献 PP 作者 AA 机构 II 国家 CC 文献P1P2P4P5P6P7 PP被以下文献所引用 作者A1AAAAAAA2A2 机构I1I2I3IIIII3 国家C1C2CCCCCCCC 问题:如果某个指标的计算提供“排除自引(nottoincludeself-citation)”选项,而用户选择了该选项,会发什么呢? 回答:如果正在被考察的实体是国家CC,则来自P4、P5、P6、P7的引用会被认为是“自引”,因为它们的署名国家与实体相同,即国家CC;在计算指标时这4次引用将不会被计算在内。
回答:如果正在被考察的实体是机构II,则来自P5、P6的引用会被认为是“自引”,因为它们的署名机构与实体相同,即机构II;在计算指标时这2次引用将不会被计算在内。
回答:如果正在被考察的实体是研究者,其中包含作者AA,则来自P2、P4、P5的引用会被认为是“自引”,因为它们的作者同时也是实体中的作者,即作者AA;在计算指标时这3次引用将不会被计算在内。
无论考察的实体是什么,来自P1的引用都不会被认为是自引。
/research-intelligence/scival 17 实例1b:自引的排除 案例描述:用户正在考察一个实体,可能是国家、研究机构或者研究者,这个实体由3篇文献(P4、
P5、P6)构成: -文献P4有2个作者:A2和A5。
他们均署名机构是I2,国家是C2。
-文献P5有2个作者:A1和A3。
作者A1有两个署名机构I1和I3,分别对应国家C1和C2;作者A3的署名机构是I2,国家是C2。
-文献P6与文献P5的作者相同:A1和A3。
作者A1仍有两个署名机构,其一仍为国家C2的机构I3,而第二个则变为国家C4的机构I5;作者A3署名机构也变为I5,国家C4。
文献P4、P5、P6共得到3次引用,分别来自文献P1、P2、P43。
文献P4P5 P6 作者A2A5 A1 A3A3 A1 机构I2I2I3I1I2I5I5I3 国家C2C2C2C1C2C4C4C2 文献P1P2 P3 P4、P5和P6被以下文章引用 作者A1A3 A3 A4A4A5 A6A2 机构I6I6I2I3I3I4I2I6I6I4 18 国家C4C4C2C2C2C3C2C4C4C3 Elsevier科研管理解决方案|SciVal 问题:如果某个指标的计算提供“排除自引(nottoincludeself-citation)”选项,而用户选择了该选项,会发什么呢? 回答:如果正在考察的实体为国家,分别为C1、C2、C4或者它们的组合时,那么:-P1对P6的引用是自引,因为署名国家都有C4-P2对P4、P5、P6的引用均是自引,因为署名国家都有C2-P3对P4、P5、P6的引用均是自引,因为署名国家都有C2,并且P3和P6的另一个署名国家也相同,即C4-P1对P4、P5的引用不是自引,因为它们没有相同的署名国家 回答:如果正在考察的实体为机构,分别为I1、I2、I3、I5或者它们的组合时,那么:-P2对P4、P5、P6的引用均是自引,因为P2和P4、P5有相同的署名机构I2,和P5、P6有相同的署名机构I3-P3对P4、P5的引用均是自引,因为P3和P4、P5有相同的署名机构I2-P1对P4、P5、P6的引用均不是自引,因为它们没有相同的署名机构-P3对P6的引用也不是自引,它们也没有相同的署名机构 回答:如果正在考察的实体为研究者,并包含A1、A2、A3、A5或者它们的组合时,那么:-P1对P5、P6的引用是自引,因为署名作者都有A1和A3-P2对P5、P6的引用均是自引,因为署名作者都有A3-P3对P4的引用是自引,因为署名作者都有A2和A5-P1、P2对P4的引用不是自引,因为它们没有相同的署名作者-P3对P5、P6的引用也不是自引,它们也没有相同的署名作者 /research-intelligence/scival 19
3.指标的合理选择 在进行科研管理决策时,理想状态是拥有3种参考信息:同行评议、专家意见和基于数据的事实信息。
当
这些互补的信息交叉验证并给出相似的结论时,用户就可以更加确信自己决策是正确的;当这些信息有相互冲突时,则提醒人们需要花时间去做更深入的调查研究。
基于数据的事实信息可以更好地为解决问题提供多个视角。
通常情况下,针对一个问题会向多人征询专业意见,同时引入多人进行同行评议也非常典型;同理,通过选取两、三个甚至更多不同指标交叉验证从而获得的事实信息也能确保结论的高可靠性。
除了对问题进行多方面分析之外,指标选择并没有严格的规定。
最合理的指标选择通常取决于用户的特定问题。
最好的办法是能够突出某些要点,这些要点通常情况下是那些需要被记住的、用户可应用常识解决问题的关键点。
SciVal提供了多种指标,使得用户能得到可以交叉验证所需的事实信息,以迎合用户可能提出来的大量且多样
的问题。
它基于丰富强大的信息资源,帮助用户凝练观点,这些观点可以对其他来源的信息提供有益的补充。
本章的主要内容将介绍影响指标的各种因素,如何恰当地选择指标。
3.1明确问题 使用数据和度量指标进行决策的目标是:任何指标中可察觉到的差异都应该反映出学术表现的差异。
如果用户选择的指标有助于回答提出的问题,首先必须取决于是否满足两个重要的因素: •问题被明确阐述 •用户明白,除了学术表现之外还有别的因素会影响指标的值。
而这个因素是否重要,也只有当问题被明确阐述之后才可以做出判断。
典型的问题通常有三种: •绩效评估,比如国家为分配资助基金而对科研机构进行的绩效评估,或者是上级在讨论下属职业发展所作的绩效评估。
在上述情况下,为了确保评价的公平性,除了学术表现指标的绝对差异之外,考量其他变量也是非常重要的,比如,在化学学科和免疫学科之间进行比较时,如果使用的指标未考虑到免疫学科倾向于有更高的科研产出量和引用率,那么这种比较是不可取的。
•成果展示,比如在撰写竞争性的基金申请书或者吸引研究生来研究机构工作这些情况下,用户的目标通常是找到更好展示分析目标成果卓越度的方法,此时他们可能更愿意使用那些有利于己方的指标。
比如,大型机构可能会选择“能力指标(powermetrics)”这类指标,因为这类指标的值随着分析对象规模的增大而变大;反之,小型机构可能会选择规模归一化后的指标。
•特定场景,比如为研究团队招聘或者院系重组提供支持。
学术表现之外影响指标值的因素是否重要,取决于特定场景的具体模式。
3.2除了学术表现,其它影响指标值的因素 本节讨论的是,绩效之外可能影响指标值的六种因素: •规模 •学科 20 Elsevier科研管理解决方案|SciVal •出版物类型•处理方法 •数据库收录范围•时间 SciVal提供的相关指标是否受到这些因素的影响,详见表3所示。
如果针对特定问题,未考虑到某些非常重要的因素,SciVal将为用户提供功能选项或其他指标测度;在本手册后续的章节会进行详细阐述。
科研产出量(ScholarlyOutput)期刊计数(JournalCount)期刊分类计数(JournalCategoryCount)被引频次(CitationCount)获得引用的文献数量(CitedPublications)篇均被引频次(CitationsperPublication)施引文献覆盖国家计数(NubmerofCitingCountries)学科归一化影响力(Field-WeightedCitationImpact)文献合作(Collaboration)合作影响力(CollaborationImpact)校企合作(Academic-CorporateCollabration)校企合作影响力(Academic-CorporateCollaborationImpact)高被引文献(OutputsinTopPercentiles)高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)h指数(h-indices) 规模归一化?
学科领域归一化?
出版物类型归一化?
与数据库收录范围相关?
不易人为操控?
无时间相关性?
表3:SciVal指标的特性。
在“规模归一化”列中半阴影格对应的指标,SciVal提供两种选项:“百分比(Percentage)”和“绝对数值(AbsoluteNumber)”,前者为规模归一化的选项,后者则不是。
3.2.1规模 有些指标的值会随着分析对象规模的增大而增加,比如显示分析对象生产力的“科研产出(ScholarlyOutput)”、被引用总量的被引频次(CitationCount)”。
这些指标在本指南中被称为“能力指标集(Powermetrics)”(如表1所示)。
在绩效评估时,考虑分析对象的规模差异往往是很重要的;比如,篇均被引频次(CitationsperPublication)就考虑到了分析对象学术产出规模的差异,它对于揭示每条记录的被引效率来说很有帮助。
然而,当展示成果时,“能力指标集(Powermetrics)”对于大型研究机构来说比较有利,因为它在这些指标上的表现往往看上去更好;被引数量亦如此,规模较大合作网络的被引量往往比小的研究团队的被引量更多。
3.2.2学科 不同学科的学术工作在研究方法和交流方式上存在显著的差异。
这些行为差异不存在谁好谁坏的问题,仅仅是与特定研究领域相关的一个事实。
/research-intelligence/scival 21 任何被引频次类或篇均被引频次方面的指标都能有效显示这种学科差异。
比如,神经科学领域在上述指标上
的得分往往明显高于工程学,但显然不能说明神经科学通常比工程学“好”。
这类指标没有考虑到学科的差异性,我们不建议使用它们进行学科之间的直接比较;我们推荐采用学科归一化的指标,比如“学科归一化影响力指标(Field-WeightedCitationImpact)”、“高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)”,以及免费的期刊计量指标SNIP和SJR12等等。
这些行为差异不只影响被引频次类或篇均被引频次方面的指标,实际上它们会影响在科研管理中使用到的所有指标,这其中就包括SciVal中的指标。
是什么引起了这些差异呢? •出版频率:与数学领域的学者相比,化学工程等领域的研究者发表论文更为频繁; •参考文献列表的长度:毒理学等领域文后所列参考文献往往比社会科学的要多得多; •合著者的数量:物理学研究的合作通常比人文艺术领域要多,因而每篇论文的合著者更多。
图1给出了所有学科的学术行为典型分布特征。
神经科学生命科学药理学和毒理学化学和化学工程 物理学环境科学健康科学地球科学 生物学社会科学材料科学与工 程学数学与计算 机科学艺术与人文 高 •出版频率•参考文献列表长度•合作者数量 低 图1:不同学科的学术行为特征 学科差异性对指标来说意味着什么?神经科学和生命科学的大多数指标值要高于材料科学和计算机科学;这并不足以反映学科表现,仅仅反映了这些学科的特定研究方式。
当分析目标是展现神经科学的某项学术研究的成果时,直接使用这些指标是恰当的,但是在进行绩效评估时就必须意识到这种学科差异对指标的影响。
如果用户需要进行学科之间的比较,建议: •使用“研究领域筛选(ResearchAreafilter)”功能:当比较涵盖多学科的分析对象(比如机构或国家)时,使用该功能可以聚焦于这些分析对象都有的学科领域; 12: 22 Elsevier科研管理解决方案|SciVal •选择领域归一化后的指标(field-normalizedmetrics),如领域归一化影响力(Field-WeightedCitationImpact)指标。
值得注意的是,当考虑到学科对指标值的影响时,有许多定义学科的方法: •期刊分类(JournalClassifications)可能是定义学科最常用的方法, -比如,Scopus将其索引的期刊分为27个主类别(MainCategories),又细分为300余个子类别(Sub-Categories);巴西CAPES基金13,也像其他许多组织一样,有自己的期刊分类; -这些分类为用户使用SciVal等工具带来了很大的好处:无论用户调查何种分析对象,都能使用具有相同含义的分类。
比如:在不同研究机构里,化学系的涉及涵盖的研究领域和方向可能有所不同,此时进行化学的基准对标分析会有问题。
如果用户利用某一特定的期刊分类对这些研究机构的科研产出进行筛选,就可确信这是在相对具有一致定义的化学学科中进行的横向比较。
正是上面的原因,SciVal中的“研究领域(ResearchAreafilter)”提供基于期刊分类的数据筛选; -期刊分类的缺点是,它们往往因为体系非常庞大而很难及时跟上研究的最新进展;另外期刊的分类决定了期刊所包含的每一篇文章的分类,过于武断。
•文献级别的分类(Publication-levelclassifications)正受到越来越多的关注,这源于学术界学科演化速度的加快以及处理海量数据集技术的进步: -这种分类并不像期刊分类那样武断地将期刊的学科类别直接赋予期刊中的文献,而是依据文献的参考文献以及引用它们的文献来确定分类; -学者看待研究领域的方式是不断变换的,文献级别的分类对于跟上他们的步伐来说十分有用,而且有助于揭示新生、新兴领域。
SciVal竞争力图谱中展示的全球研究优势,因为采用了文献级别的分类才如实地反映出当前研究热点,它呈现出近期出版物如何引用之前作品。
基于同样的原因,SciVal中的学科归一化影响力指标(Field-WeightedCitationImpact)时也采用了文献级别的分类。
-文献级别的分类缺点是: -有些文献往往不易被分类,比如当文献没有或只有一个很短的参考文献列表,而且/或者它还没有被引用过的时候; -要实现一个不断变化的分类体系,计算成本会非常高; -由于引文模式变化引起的分类频繁变化,降低了指标计算中底层数据的透明度。
•用户自定义的学科(User-defineddisciplines),比如通过在数据库的标题和摘要中选取特定检索关键词来定义: -用户自定义学科的优点在于:确保用户能够自己定义他们的研究领域,只要这对于用户和他们的研究问题来说是有意义的即可。
这是因为学者开展的研究可能并不能恰好符合已有期刊分类以及同行们此前的引用 13:/en/Programs/CAPES /research-intelligence/scival 23 行为;而且当学者刚开始关注一个新的领域时,即使是文献级别的分类也无法探测到该领域开始形成的最
初阶段。
-用户定义学科的缺点是这种定义很可能是独特的,这为其他想要使用或者证实这些自定义领域的人带来了挑战。
3.2.3出版物类型 不同类型出版物的引用率往往不同。
一个众所周知的例子是综述文章往往比原创性文章吸引到更多的引用,事实上其它不同类型文章的引用率也有差异,如图2所示: 图2:Scopus中不同类型文献的引用率。
数据范围是2008-2012年期间发表的文献截至2013年八月的被引频次。
CitationsperPublication eport rticle Bookrticle apter aper view ationitorialratum ress etterL Noteeviewurvey tR
A essA Chok enceP ceRe issert Ed Erle-in-
P RortS AbstracBusinBoonfernferenDArticSh
C Co 图2的横坐标,从左至右依次是:摘要报告、论文、图书、商业论文、书的章节、会议论文、会议评论、学位论文、社论、勘误、待刊论文、书信、注解、综述、简短调查;纵坐标为篇均被引频次。
如果需要评估整体科研成果的学术表现,或期刊编辑希望证实期刊总体生产率并保持社论对引用的积极影响(自引),文献类型的差别可能并不重要。
不过在有些情况下可能需要关注特定的文献类型,例如:工程与计算机科学领域有时需要特别关注会议论文;而在比较常撰写社论的期刊编辑和不担任期刊编辑的科研学者时,则需要更多地关注原创研究论文。
如果出版类型对于引用的影响对于用户要分析的问题来说需要去除,建议他们使用以下方法: 24 Elsevier科研管理解决方案|SciVal •应用文献类型筛选(Publication-typefilter)功能 •使用学科归一化影响力指标(Field-WeightedCitationImpact)(该指标对出版物类型进行了归一化处理) 3.2.4数据库收录范围 数据库对于其所收录的信息内容有专门的指南文档。
Scopus根据其收录政策14遴选契合其目标的信息内容;该政策具有选择性,并不包括全球范围内的每一篇文献。
这意味着分析目标所发表的某些文献如果没有被Scopus索引,也就不能参与到SciVal指标计算中。
数据库的收录范围涵盖下述两个方面: •地理范围:Scopus索引的内容来自全球5000多家出版社。
从图3Scopus所收录来源文献的地理分布图可以看出这些出版商分布于全球,尤以美国和英国更为集中(颜色最深)。
这一地理覆盖范围应当支持对于全球关注话题的全面分析;然而,对于主要是地域性研究的领域(比如民族文学、历史、文化)来说,Scopus可能无法提供充分完整的数据。
•学科范围:Scopus持续扩张的收录内容意味着其覆盖的学科范围将会不断变化。
我们可以通过新出版文献的引文收录情况来估计学科范围:这些引文能链接到Scopus数据库记录的比例被假设为代表学科的已覆盖率;引文没有被数据库收录的话就被假设为缺乏覆盖。
此方法估算出的是最低的覆盖水平,实际的学科覆盖率可能比图4所示的要高几个百分点。
图3:截至2013年1月,Scopus来源文献(期刊、会议录和图书等)的地理分布。
来源文献所属国为出版商版权所在国。
0-5,000代表来源文献的密度。
14:/online-tools/scopus/content-overview /research-intelligence/scival 25 链接至Scopus1995之后记录的引文 链接至Scopus1996之前记录或的不在Scopus中引文 neralcesitiesogytingringGeScienumanrounginee logicalandHleculaandAicalEn Bioland Arts ndMo entm Chem ticsaanage lturaricu ,Geneess,
M AgemistryBusin Bioch istrym cience iences iences ance CheuterSionScaryScndFin CompDecistricsandome arthaEcon Eics, nom Eco Energyeeringienceology cience aticsm dicine cience ursing utics nomyhologyienceserinaryntistryssions EnginntalScicrobirialsSMathe me ndM ateM MeNeuros
N acem Astro Psyc ialSc Vet arand Soc dPhcs DehProfeealt Environlogya gyanPhysiH uno icolo m Tox Imlogy, aco Pharm 图4:Scopus收录文献的学科覆盖范围估计。
这里用到了发表于2008-2012年间文献的引文,由于Scopus的引文索引始于1996年,所以发表于1996年之前的引文记录没有被计算在内,这造成图中的学科覆盖率低于实际情况。
此分析所用数据截至2013年8月。
图4的横坐标依次为:综合,农业与生物学,艺术与人文,生物化学、遗传学与分子生物学,商业、管理与会计学,化学工程,化学,计算机科学,决策学,地球与行星科学,经济学、计量经济学与金融,能源,工程学,环境科学,免疫学与微生物学,材料科学,数学,医学,神经科学,护理学,药理学、毒理学与药剂学,物理与天文学,心理学,社会科学,兽医,牙科,医疗专业人员 在与同行进行大数据量集级别上的比较时,分析对象的科研产出有一些被遗漏通常是可以接受的,这是因为数据库收录内容的缺失对于“大”分析对象的影响是一样的,并不会影响到分析对象之间对比的有效性。
但是,要注意的是,当对比“小”的分析对象时,即使一篇文献的遗漏可能就会造成很大的消极影响,比如,在评价某个学者的学术表现时,他所发表文献或者引用他的文献如果没有全部被数据库收录,指标数值将会受到影响。
分析对象的“大”与“小”是一个需要判断的问题,而且也因学科不同而异。
解决这个问题的唯一方式就是在使用SciVal支持决策时,保持谨慎并运用常识。
数据库收录范围影响方面的问题常常与人文艺术和社会科学有关:SciVal中的指标在这些领域里有用吗?在某些情况下,它们是有用的: •理论上,SciVal所支持的决策应当建立在同行评审、专家意见以及数字实证基础之上。
除了文献数量及其影 26 Elsevier科研管理解决方案|SciVal 响力,还有基金获取情况、创新性、社会影响力等都应该在评价中被考虑,尽管后面的信息尚未被SciVal收
录。
这对于所有学科都适用,人文艺术和社会科学领域也不例外。
•对于人文艺术和社会科学领域来说,它们文献的学科覆盖率在Scopus或者其他商业数据库中往往都较低,这是个需要被进一步关注的问题。
这种现象也是该领域学者出版行为的一个自然结果,他们的科研成果往往是出版独立的书,而书与连续出版物之间的关联很难被捕捉到,尽管Scopus现在已专注于增加对书的收录。
不过,如果牢记针对分析对象规模的指导方针,还是可以从SciVal中获取关于这些领域学术表现有价值的信息。
3.2.5人为操控 有些情况下,可以利用人为操控以提升某些文献计量指标值。
例如,为了提升报告上的数字而将一些研究单位组合在一起以扩大规模,从而在使用能力指标集“Powermetrics”时提高业绩表现。
另一个例子是自引。
自引从本质上来说并无不妥:它是一种正常的学术行为,因为研究总是建立在之前发表的成果之上,而且作者有责任为读者提供以往的资料作为参考以帮助他们理解最新的进展。
然而,这种行为易遭滥用,比如某些学者可能会选择引用自己其它本不相关的论文以增加自身的被引量,或者期刊编辑偶尔会强迫投稿人在参考文献里增加很多自己期刊的论文引用。
引文影响力指标集(CitationImpact)是SciVal中最容易受人为影响的指标。
尽管自引的滥用十分少见,但是用户如果愿意的话,可以选择将自引从这些指标中排除出去(如表1所示)。
其他的指标受人为操控的影响相对要小的多,如科研产出与合作方面的指标。
3.2.6时间 时间跨度对于某些指标来说十分重要。
最明显的就是引文影响力(CitationImpact)指标集,因为出版物积累引用需要一定的时间。
h指数是另外一个例子,它对时间不敏感,如果用该指数评价处于研究生涯早期的青年研究者用处不大,因为这些青年研究人员需要时间以积累更多的科研成果以及引用。
一些与时间无关的指标可以在文献被收录于数据库时立即使用。
比如通过使用机构署名信息来探寻合作关系的那些指标。
甚至有一个引文影响力(CitationImpact)指标也与时间无关:高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)这一指标使用的是文献所在期刊的被引频次。
/research-intelligence/scival 27
4.SciVal指标:使用方法 本节介绍了SciVal提供的具体指标以及这些指标的计算方法、使用场景,并强调了使用中的注意事项。
我们建议选择多个指标相互配合使用,用于克服特定单一指标所带来的结果误差缺陷,或用于强调互为补充
的信息。
这些建议指标如表4所示;这些建议并非强制规定,只是使用指南,以帮助用户选择适当的指标。
对于指标... 科研产出(Scholarlyoutput) 期刊计数(JournalCount)期刊分类计数(JournalCategoryCount) 被引频次(CitationCount) 获得引用的文献数量(CitedPublication) 篇均被引频次(CitationperPublication) 施引文献覆盖国家计数(NumberofCitingCountries) 领域归一化影响力 (Field-WeightedCitationImpact,FWCI) 文献合作(Collaboration) 文献合作影响力(CollaborationImpact) 校企合作(Academic-CorporateCollaboration)校企合作影响力 (Academic-CorporateCollaborationImpact) 高被引文献量(OutputsinTopPercentiles) 高百分位期刊中的发文量(PublicationsinTopJournalPercentiles) h指数(h-indices) ...可配合使用的指标包括: 科研产出(Scholarly output) 期刊计数(JournalCount) 期刊分类计数(JournalCategoryCount) 被引频次(CitationCount) 获得引用的文献数量(CitedPublication) 篇均被引频次(CitationperPublication) 表4:指标配合使用建议 28 Elsevier科研管理解决方案|SciVal ...可配合使用的指标包括: 施引文献覆盖国家计数(Number ofCitingCountries) 学科归一化影响力(Field-WeightedCitationImpact,FWCI) 文献合作(Collaboration) 文献合作影响力(Collaboration Impact) 校企合作(Academic-CorporateCollaboration) 校企合作影响力(Academic-Corporate CollaborationImpact) 高被引文献量(OutputsinTopPercen- tiles) 高百分位期刊中的发文量 (PublicationsinTopJournal Percentiles) h指数(h-indices) “对体量敏感的指标”与时间累计无关的指标指标值高低的沟通信息天然互补的指标基于文献的真实表现,而不是其所在期刊的平均水平文献至少需要被引用1次才能被使用避免在近些年出现“引用缺失” /research-intelligence/scival 29 4.1SciVal中指标的展示 SciVal的指标完全按照计算结果显示。
有时用户可能倾向于使用多年平均值,以“抹平”趋势曲线的剧烈起伏,但是SciVal不提供这种“抹平”手法,以保证指标数据的透明性。
这就意味着SciVal的部分趋势线看起来“跌宕起伏”,特别是在遇到小型数据集(如单个研究者)指标计算情况。
当然,展示大型数据集的指标时,趋势线一般会比较平缓。
4.2指标:科研产出(Scholarlyoutput) SciVal中的科研产出(Scholarlyoutput)反映了分析对象的生产力,即该分析对象有多少论文被Scopus收录。
科研产出(Scholarlyoutput)是一个: •生产率指标;•雪球指标; •体量敏感指标。
指标可用于: •对比分析相似(近似规模和研究领域)分析对象的生产力,例如:有研究者数量相近的研究机构;有相近研究领域和职业生涯长度的研究者; •当指标值比较大时,可以在图表中突出展示分析对象较同行的学术表现更好;•提供透明的底层数据来建立SciVal指标的信任度;•以一种难以被人为操控的方式分析出版行为;•当关于一种新方法的文献或者青年学者刚出现时就可以发现其早期活动。
指标在以下场合需谨慎使用: •当规模体量有较大差异的分析对象相互比较时,比如国家与研究机构,大型合作网络与独立研究者,或者长期稳定的研究领域和小型新兴研究领域相比较时: -对比这类分析对象时,指标值的差异反映的可能是分析对象规模的差异而非生产力的差异; -建议用户仅仅在对比相似分析对象时使用该指标,或者使用“篇均被引频次”这类体量归一化的指标进行比较。
•具有不同学科领域布局的分析对象进行基准对比分析时, -不同领域的学术研究往往发文规律相差较大。
例如,生命科学领域占比较高的研究机构,往往发文频率较高,与同等规模的人文科学领域占比较高的研究机构相比可能有更高的科研产出; -在这种情况下,科研产出的不同更有可能反映学科特性的差异,而不能为生产力差异提供可靠数据; 30 Elsevier科研管理解决方案|SciVal -使用该指标来对比有着不同学科背景的分析对象时,应考虑到这些差异; -在比较多学科分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对象共有的领域,或者使用领域归一化的指标进行分析,如“高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)”。
•理解在Scopus收录范围中有文献缺失的小型分析对象的生产力: -小规模数据集合中单篇文献的缺失有可能对表观生产力的指标值产生显著的负面影响; -解决这一问题的唯一方法就是提高警惕。
建议用户将“科研产出(Scholarlyoutput)”指标用于对比大规模数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不会使比较结果失真。
可配合使用的指标包括: •被引频次(CitationCount):分析对象所有文献被引用次数的总和,它是对科研产出(Scholarlyoutput)指标的自然补充; •h指数(h-indices):综合了科研产出和被引频次的指标; •其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标的值随着分析对象规模变大而增加,具体包括:期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),被引频次(CitationCount),获得引用的文献数量(CitedPublication,“绝对数值”),施引文献覆盖国家计数(NumberofCitingCountries),文献合作(Collaboration,“绝对数值”),校企合作(Academic-CorporateCollaboration,“绝对数值”),高被引文献量(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他无时间相关性的指标集,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
参见示例
2。
4.3指标:期刊计数(JournalCount) SciVal指标中的期刊计数(JournalCount)反映一个分析对象的文献组合多样性,即这个分析对象的文献发表在多少种不同的Scopus期刊上。
期刊计数(JournalCount)是一个: •学科指标 •体量敏感指标 /research-intelligence/scival 31 该指标可用于: •对比小规模分析对象,比如研究者和文献集合,其期刊分布组合的差异最为明显; •当指标值相对较大时,可以在图表中突出展示一个相对较大的分析对象的表现; •对比分析相关分析对象文献组合的多样性,比如研究机构模拟探讨招收各类研究者的效果,或者在某些研究领域建立合作网络的效果; •展示分析对象的工作跨越传统学科的卓越性,并为投稿提供潜在的目标期刊; •提供透明的底层数据来建立SciVal指标的信任度; •以一种难以被人为操控的方式分析出版行为; •当关于一种新方法的文献或者青年学者刚出现时就可以发现其早期活动。
指标在以下场合需谨慎使用: •对比大型分析对象,比如研究机构和研究机构群组发表大量文章,并且文章所在期刊分布非常广泛,有可能达到Scopus数据库最大限度导致区别或许看上去并不明显。
建议用户在使用该指标时运用数据筛选选项,例如研究领域筛选(ResearchAreafilter),将比较范围缩小至大型分析对象的某些特定学科; •当规模体量有较大差异的分析对象相互比较时,如有150位学者的系和30位学者的系 -比较此类分析对象时,体量敏感指标值的不同反映的可能是分析对象规模的差异,而不是文献组合多样性的差异; -建议用户在对比同等规模分析对象时使用该指标,或者使用如“文献合作”这类体量归一化的指标进行比较。
•具有不同学科领域布局的分析对象进行基准对比分析时,处于不同学科领域的学者投稿的期刊范围可能大不相同: -在这种情况下期刊数量差异反映的可能是学科特点的差异,并不能为文献组合差异提供可靠信息; -使用该指标比较不同学科的分析对象时,应考虑这些差异; -比较多种学科组成的分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对象共有的领域,或者使用“学科归一化影响力(Field-WeightedCitationImpact)”等学科归一化的指标; •理解在Scopus覆盖范围内可能有缺失的小型分析对象的生产力:-小型数据集中单篇文献的缺失有可能对文献组合的广度有显著的负面影响; 32 Elsevier科研管理解决方案|SciVal -解决这一问题的唯一方法是提高警惕。
建议用户将“期刊计数(JournalCount)”指标用于对比大型数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不会使比较结果失真。
可用的辅助指标包括: •期刊分类计数(JournalCategoryCount):凸显分析对象的学科广度,是期刊计数(JournalCount)的自然补充; •其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标值随着分析对象规模增大而值增加:科研产出(Scholarlyoutput),期刊分类计数(JournalCategoryCount),被引频次(CitationCount),获得引用的文献数量(CitedPublication,“绝对数值”),施引文献覆盖国家计数(NumberofCitingCountries),文献合作(Collaboration,“绝对数值”),校企合作(Academic-CorporateCollaboration,“绝对数值”),高被引文献量(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他“无时间相关性指标”集合,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:期刊分类计数(JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
4.4指标:期刊分类计数(JournalCategoryCount) SciVal中期刊分类计数(JournalCategoryCount)反映分析对象学科组合的多样性,即分析对象文献发表在多少种不同的期刊类别中。
期刊分类计数(JournalCategoryCount)的计算结果既可以基于主类别生成也可以通过子类别生成。
其中Scopus期刊主分类有27种,子分类有334种。
SciVal中有2种方式对文献进行分类: •“期刊主导型”分类法,假设一篇文献的分类取决于这篇文献所在期刊的分类。
所有文献自动采用期刊对应的主题分类。
这种分类方法适用于集中于一个核心领域、一般不发表其他领域相关文献的期刊; •“文献主导型”分类法,假设期刊内的文献在期刊范畴的核心领域外有其他相关领域。
文献主导型分类法允许从期刊中另行分配个别文献到与其相关的分类中。
这对多学科期刊的文献有重要意义。
期刊分类计数(JournalCategoryCount)采用“文献主导型”分类法,一篇文献可以被分配到多种类别中。
期刊分类计数(JournalCategoryCount)是一个: •学科指标 •体量敏感指标 参见示例
2。
/research-intelligence/scival 33 该指标可用于:•对比小规模分析对象,比如研究者群组和文献集群组,其期刊分布组合的差异最为明显;•当指标值相对较大时,可以在图表中突出展示一个相对较大的分析对象的表现;•对比分析相关分析对象学科组合的多样性,比如由特定基金的同一经费资助的合作网络;•通过揭示分析对象的产出对不同学科读者的吸引力提供跨学科的证据;•提供透明的底层数据来建立SciVal指标的信任度;•以一种难以被人为操控的方式分析出版行为;•当关于一种新方法或者青年学者的文献刚出现时就可以发现其早期活动的不同。
指标在以下场合需谨慎使用 •对比大型的分析对象,比如研究机构和研究机构群组发表大量文章,并且文章所在期刊分布非常广泛,有可能达到Scopus数据库最大限度导致区别或许看上去并不明显。
建议用户在使用该指标时运用数据筛选选项,例如研究领域筛选(ResearchAreafilter),将比较范围缩小至大型分析对象的某些特定学科; •当规模体量有较大差异的分析对象相互比较时,如具有单一论文集合的大型合作网络: -比较此类分析对象时,体量敏感指标值的不同反映的可能是分析对象规模的差异,而不是文献组合多样性的差异 -建议用户在对比同等规模分析对象时使用该指标,或者使用如“校企合作”这类体量归一化的指标进行比较。
•对比分析独特学科分析对象的生产力,从事独特学科研究的学者在从事跨学科研究中可能有不同的行为方式: -在这种情况下,期刊分类计数的差异反映的可能是不同独特学科的特点,而不能为学科组合的差异提供可靠信息; -使用该指标对比不同独特学科的分析对象时,应考虑到这一差异; -当对比多学科分析对象(如机构或国家)时,建议用户通过筛选研究领域来聚焦于所有分析对象共有的一个领域,或者使用诸如高百分位期刊中的发文量等领域归一化的指标。
•理解在Scopus覆盖范围内可能有缺失的小型分析对象的生产力:-小型数据集中单篇文献的缺失有可能对文献组合的广度有显著的负面影响; -解决这一问题的唯一方法是提高警惕。
建议用户将“期刊计数(JournalCount)”指标用于对比大型数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不会使比较结果失真。
34 Elsevier科研管理解决方案|SciVal 可用的辅助指标包括: •期刊分类计数(JournalCategoryCount),突出分析对象的文献组合,也是对期刊分类计数(JournalCategoryCount)的自然补充; •其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标值随着分析对象规模增大而值增加:科研产出(Scholarlyoutput),期刊分类计数(JournalCategoryCount),被引频次(CitationCount),获得引用的文献数量(CitedPublication,“绝对数值”),施引文献覆盖国家计数(NumberofCitingCountries),文献合作(Collaboration,“绝对数值”),校企合作(Academic-CorporateCollaboration,“绝对数值”),的文献量(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他“无时间相关性指标”集合,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:科研产出(Scholarlyoutput),期刊计数(JournalCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
参见示例
2。
/research-intelligence/scival 35 示例2:科研产出(ScholarlyOutput),期刊计数(JournalCount)和期刊分类计数(JournalCategoryCount) 实例:用户需要计算分析对象的科研产出(ScholarlyOutput),期刊计数(JournalCount)和期刊分类计数(JournalCategoryCount),该分析对象有6篇文献,选择以下查看和计算选项。
选择时间范围选择文献类型选择研究领域 2008-2012Articles,reviewsandconferencepapers AgriculturalandBiologicalSciences 文献ID出版年文献的来源出版物文献类型 期刊子类别 文献是否符合用户选择的选项? 步骤
1 期刊主类别文献的期刊类别是否符合选择的研究领域? 有6篇文献的分析对象 文献12007BioscienceJournalArticle GeneralAgriculturalandBiologicalSciences AgriculturalandBiologicalSciences 文献
2 2009 BiologyandEnvironment Article AnimalScienceandZoology AquaticScience, AgriculturalandAgriculturalandBiologicalSciencesBiologicalSciences 是 是 是 步骤
2 文献是否符合选取的时间范围? 否 是 步骤
3 文献类别是否符合选择的文献类别? 是 是 步骤
4 文献是否通过步骤1,2和3? 否 是 问: 答:计算在步骤4中得到“是” 怎样计算科研产出?
的文献数量。
问:怎样计算期刊数量? 答:注意步骤4中得到的“是”的文献的唯一期刊标题。
–计算唯一期刊标题的数量 问:怎样计算期刊类别数量(主类别)? 答:查找主分类–去重 –计算唯一主分类的数量 问:怎样计算期刊类别数量(子类别)? 答:查看子分类–去重 –计算唯一子分类的数量 科研产出(ScholarlyOutput)=
3 对筛选后文献的期刊标题进行去重。
BiologyandEnvironment,ArchivfürLebensmittelhygiene 期刊数量(JournalCount)=
2 对通过筛选的文献的主类别名称进行去重AgriculturalandBiologicalSciences 期刊主分类计数(JournalMainCategoryCount)=
1 对通过筛选的文献的子类别进行去重。
AgronomyandCropScience,AnimalScienceandZoology,AquaticScience,Horticulture 期刊子分类计数(JournalSub-CategoryCount)=
4 36 Elsevier科研管理解决方案|SciVal 文献32009BiologyandEnvironmentArticleInPress InsectScience EnvironmentalChemistry AgriculturalandEnvironmental BiologicalSciences Science 有6篇文献的分析对象 文献42008BiologyandEnvironmentReview 文献52010 ArchivfürLebensmittelhygieneArticle 文献62010ArchivfürLebensmittelhygieneReport AgronomyandCropScience Horticulture OrganicChemistry AgriculturalandBiologicalSciences AgriculturalandBiologicalSciences Chemistry 是 否 是 是 是 否 是 否 是 是 否 是 是 是 否 是 否 /research-intelligence/scival 37 4.5
指标:被引频次(CitationCount) SciVal中被引频次(CitationCount)表示特定分析对象的总体引用影响力,即该分析对象的科研产出总共被引用的次数。
被引频次(CitationCount)是一个: •引文影响力指标;•雪球指标;•体量敏感指标。
SciVal通常情况下以图表来表现历年的被引频次,这些年份通常是文献的出版年份,而不是施引文献的引用年份。
指标可用于: •对比分析相似(近似规模和研究领域)分析对象的可见度,如研究人员数量相近的学科机构,或类似学科的国际合作网络;•当指标值比较大时,可以在图表中突出展示分析对象较同行的学术表现更好;•展示出某一分析对象发表了一些高被引文献;•提供透明的底层数据来建立SciVal指标的信任度。
指标在以下场合需谨慎使用: •当规模体量有较大差异的分析对象相互比较可见度时,“体量敏感指标”更确切地反映了分析对象大小而不是可见度差异,一组机构(如美国的一个州)的引用数量通常高于单个机构。
建议用户使用体量归一化影响力指标“篇均被引频次 (CitationperPublication)”或者学科归一化影响力指标(Field-CitationImpact)来分析不同大小实体间的可见度。
•具有不同学科领域布局的分析对象进行基准对比分析时:-例如,医学和病毒学学者的发表与引用频率都较高,而商学院或语言学学者的发表与引用频率则较低;-在没有说明差异时,该指标不适用于比较不同学科;-在比较多学科分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对象共 有的领域,或者使用领域归一化的指标进行分析。
•具有不同学科领域布局的分析对象进行基准对比分析时:-例如,医学和病毒学学者的发表与引用频率都较高,而商学院或语言学学者的发表与引用频率则较低;-在没有说明差异时,该指标不适用于比较不同学科; 38 Elsevier科研管理解决方案|SciVal -在比较多学科分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对象共有的领域,或者使用领域归一化的指标进行分析。
•研究某一分析对象的出版物被引信度,因为一篇或一些高被引文献有可能掩盖分析对象还有一些从未被引用的文献,建议用户选择被引文献数量(CitedPublications)来反映信度。
•小规模分析对象完整的科研产出与被Scopus收录的文献可能存在差异: -小规模数据集合中单篇文献的缺失有可能对分析对象的可见性带来显著的负面影响。
例如,如果某位学者发表的论文未被收录,或引用该出版物的文献未被收录,则该学者的学术表现评估会受到影响; -解决这个问题的唯一方法是提高警惕。
同时,若数据库引用缺失值较多,要考虑限制使用被引频次去对比相同学科数据集合;在指标不失效和数据缺失对所有实体产生效果较为接近的前提下可使用被引频次。
•有一种情况是过量的自引可能导致引用数量虚高。
用户可以通过取消勾选“包括自引(Includeselfcitations)”选项,判断出自引比率是否过高。
•了解文献在发表初期的影响力,或研究者尚处于职业早期时的成果表现,因为较新的文献发表时间尚未累计到足够的引用导致采用被引频次指标不可信。
建议用户在这种情况下,使用科研产出(ScholarlyOutput)或者文献合作(Collaboration)指标。
•人们在使用数据时,不希望见到近几年的“下滑”趋势曲线。
“下滑”曲线在被引频次里很常见,因为近期的新文献尚没有足够时间被人们引用。
鉴于此,建议用户使用学科归一化影响力指标(Field-WeightedCitationImpact)或高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
可配合使用的指标包括: •篇均被引频次(CitationsperPublication)和学科归一化影响力(Field-WeightedCitationImpact),为总体可见度融入补充视角,也在比较不同规模分析对象时表明差异性。
此外学科归一化影响力(Field-WeightedCitationImpact)还考虑了学科间出版和引用行为的差异; •学科归一化影响力(Field-WeightedCitationImpact)、高被引文献(OutputsinTopPercentiles)、高百分位期刊中的发文量(PublicationsinTopJournalPercentiles),可用于避免因文献发表时间较短、累计获得引用较少而导致引用数量在近年来出现“下降”趋势的问题; •被引文献数量(CitedPublications)用于测量一个分析对象的文献随后将被引用的可靠性,不会因一个或多个文献被高频引用而受到影响; •h指数(h-indices),它的价值在于将被引频次和科研产出(ScholarlyOutput)组合在一起,是自然的辅助指标; •其他“体量敏感指标集(PowerMetrics)”中的指标:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),被引文献数量(CitedPublication,“绝对数值”),引用国家数量(NumberofCitingCountries),文献合作(Collaboration,“绝对数值”), /research-intelligence/scival 39 校企合作(Academic-Corporate
Collaboration,“绝对数值”),高被引文献(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他“无时间相关性指标集合”,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
见例
3. 4.6指标:被引文献数量(CitedPublications) SciVal中的被引文献数量(CitedPublications)表示一组文献的被引情况:即该分析对象的文献中有多少篇文献至少被引用一次。
被引文献数量(CitedPublications)是一个: •引文影响力指标; •当“绝对数量(AbsoluteNumber)”选项被选中时是体量敏感指标,当“百分比(Percentage)”选项被选中时则不是。
SciVal中常以图表来表现历年的被引文献数量(CitedPublications),这些年份通常出版年份,而不是获得引用的年份。
指标可用于: •对比分析文献在多大程度上能够得到后续文献的引用; •比较规模不同、学科相近分析对象的文献影响力,例如大规模产出国家和小规模产出国家的比较,或者大规模研究团队和小规模研究团队的对比; -在比较不同规模分析对象时,建议勾选“百分比(Percentage)”选项来实现该变量的归一化。
•在不考虑被引频次的情况下,展示分析对象有能力产出可信赖的被引文献; •展现少数高被引论文对分析对象表现提升所施加的正面影响,高被引论文会显著影响文献集合的被引频次和篇均被引频次; •提供透明的底层数据来建立SciVal指标的信任度。
指标在以下场合需谨慎使用: •比较具有不同学科的分析对象所产出的文献,在多大程度上能够得到后续文献的引用; -例如,寄生虫学的研究团队与数学建模研究团队对比,前者因为其学科高频率的出版和引用行为,可能 40 Elsevier科研管理解决方案|SciVal 在从出版到被引用之间仅会经历一个短暂的间隔期,而后者间隔期相对更长;不建议用户在没有考虑学科
差异性的情况下,选择此指标进行对比分析; -比较由多个学科组成的分析对象时(如机构或国家),建议运用学科领域筛选(ResearchAreafilter)将分析对象集中于所有分析对象共有的学科领域; •了解分析对象文献的被引数量大小时,建议用户使用“被引频次(CitationCount)”或“篇均被引频次(CitationsperPublication)”来表示该信息; •小规模分析对象完整的科研产出与被Scopus收录的文献可能存在差异: -小规模数据集合中单篇文献的缺失有可能对分析对象的可见性带来显著的负面影响。
例如,如果某位学者发表的论文未被收录,或引用该出版物的文献未被收录,则该学者的学术表现评估会受到影响; -解决这个问题的唯一方法是提高警惕。
建议用户将“被引文献数量(CitedPublications)”指标用于对比相同学科领域的大规模数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不会使比较结果失真; •过量的自引可能导致引用数量虚高。
用户可以通过取消勾选“包括自引(Includeself-citations)”选项,判断出自引比率是否过高; •了解文献在发表初期的影响力,或研究者尚处于职业早期时的成果表现,因为较新的文献发表时间尚未累计到足够的引用导致被引频次指标不可信。
建议用户在这种情况下,使用“科研产出(ScholarlyOutput)”或者“文献合作(Collaboration)”指标。
可配合使用的指标包括: •被引频次(CitationCount)和篇均被引频次(CitationsperPublication),表明引用影响力的大小,一篇或几篇高被引文献会对此指标带来积极影响; •其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标的值随着分析对象规模变大而增加,具体包括:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),被引频次(CitationCount),引用国家数量(NumberofCitingCountries),文献合作 (Collaboration,“绝对数值”),校企合作(Academic-CorporateCollaboration,“绝对数值”),高被引文献(OutputsinTopPercentiles,“绝对数值”),高百分位期刊中的文献
9 (PublicationsinTopJournalPercentiles,“绝对数值”),以及h指数(h-indices); •所有其他“无时间相关性指标集合”,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数 (JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
见例
3. /research-intelligence/scival 41 4.7指标:篇均被引频次(CitationsperPublication) SciVal中的篇均被引频次(CitationsperPublication)表示特定分析对象的文献获得的平均引用影响力:即该分析对象的文献平均引用频次。
篇均被引频次(CitationsperPublication)是一个: •引文影响力指标•雪球指标 SciVal中常以图表来表现历年的篇均被引频次(CitationsperPublication),这些年份通常是出版年份,而不是获得引用的年份。
指标可用于: •对比分析不同文献集合的平均引文影响力; •比较规模不同、学科相近分析对象的文献平均影响力,如从事相似学科领域研究的研究团队,和相关研究人员间的比较; •展现少数高被引论文对分析对象的文献平均影响力提升所施加的正面影响;•提供透明的底层数据来建立SciVal指标的信任度。
指标在以下场合需谨慎使用: •比较拥有独特学科领域分析对象的文献平均影响力,如拥有大型人文科学类学院的机构和没有人文科学类学校的机构。
-在没有说明差异时,该指标不适用于比较不同学科; -比较由多个学科组成的分析对象(如机构或国家)时,建议运用学科领域筛选(ResearchAreafilter)将分析目标集中于所有分析对象的共有领域,或者选择“学科归一化影响力(Field-WeightedCitationImpact)”指标来衡量; •研究某一分析对象的文献被引信度,可能存在少量的高被引文献显著提升本指标的数值,而一定数量的零被引文献被忽略的情况。
建议用户选择“被引文献数量(CitedPublications)”来反映文献集合中被引用的数据量; •小规模分析对象完整的科研产出与被Scopus收录的文献可能存在差异: -小规模数据集合中单篇文献的缺失有可能对分析对象的可见性带来显著的负面影响。
例如,如果某位学者发表的论文未被收录,或引用该出版物的文献未被收录,则该学者的学术表现评估会受到影响; -解决这个问题的唯一方法是提高警惕。
建议用户将“篇均被引频次(CitationsperPublication)”指标用 42 Elsevier科研管理解决方案|SciVal 于对比同学科领域的大规模数据集,此时数据库覆盖范围的缺失对所有分析对象都产生类似影响,因此不
会使比较结果失真; •当分析对象科研产出规模过小,该指标会随着时间推移剧烈波动,即使在Scopus收录较完整的情况下也会产生此种现象。
“篇均被引频次(CitationsperPublication)”计算的是一个平均值,该值会显著受到小数据集影响; •过量的自引可能导致引用数量虚高。
用户可以通过取消勾选“包括自引(Includeself-citations)”选项,判断出自引比率是否过高; •了解文献在发表初期的影响力,或研究者尚处于职业早期时的成果表现,因为较新的文献发表时间尚未累计到足够的引用导致被引频次指标不可信。
建议用户在这种情况下,使用“期刊分类计数(JournalCategoryCount)”或者“文献合作(Collaboration)”指标; •人们在使用数据时,不希望见到近几年的“下滑”趋势曲线。
“下滑”曲线在被引频次里很常见,因为近期的新文献尚没有足够时间被人们引用。
鉴于此,建议用户使用“学科归一化影响力(Field-WeightedCitationImpact)”指标。
可配合使用的指标包括: •学科归一化影响力(Field-WeightedCitationImpact)指标是对文献平均影响力的自然补充,同时考虑了学科间的行为差异; •学科归一化影响力(Field-WeightedCitationImpact)、高被引文献(OutputsinTopPercentiles)和高百分位期刊中的发文量(PublicationsinTopJournalPercentiles),可用于避免因文献发表时间较短、获得引用较少而导致引用数量在近年来出现“下降”趋势的现象; •被引文献数量(CitedPublications)用于测量一个分析对象的文献随后将被引用的可靠性,不会一个或多个文献被高频引用而受到影响。
•合作影响力(CollaborationImpact)和校企合作影响力(Academic-CorporateCollaborationImpact)中有计算篇均被引频次的选项,它们是以具有合作性质的特定数据子集作为评价数据基础的。
•其他“无时间相关性指标集合”,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标:科研产出(ScholarlyOutput),期刊计数(JournalCount),期刊分类计数(JournalCategoryCount),文献合作(Collaboration),校企合作(Academic-CorporateCollaboration),以及高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
见例
3. /research-intelligence/scival 43 例3:被引频次(CitationCount)、被引文献数量(CitedPublications)与篇均被引频次(CitationsperPublication 场景:用户需要计算某个分析对象的被引频次(CitationCount)、被引文献数量(CitedPublications)与篇均被引频次(CitationsperPublication),该分析对象包括6篇文献,用户选定了以下的查看和计算选项。
出版时间范围选择(SelectedPublicationYearrange) 出版文献类型选择(SelectedPublicationTypes) 学科领域选择(SelectedResearchArea) 2005-2013Articles,reviewsandeditorials Medicine 文献是否匹配用户选定的选项? 第1步 文献信息出版时间出版文献类型此文献总被引频次期刊二级分类期刊主类别 文献期刊类别是否与被选研究范围匹配? 第2步 文献是否在被选时间范围内出版? 第3步第4步 文献类型是否和被选文献类型匹配?文献跳过了第1,2,3步骤吗? 分析对象的6篇文献 文献12008Review
0 Anthropology 文献
2 2007 Editorial
4 EmergencyMedicine ManagementScienceandOperationsResearch SocialScience Medicine DecisionSciences 否 是 否 是 是 是 是 否 是 问题:如何计算学术产出?答:计算出在第4步中选择“是”的文献数量。
问题: 答:检索出第4步中选择“是”的文献引用数量。
如何计算被引频次? 科研产出(ScholarlyOutput)=
4 N/A
4 问题:如何计算被引文献数量? 问题:如何计算篇均被引频次? -第4步中选择是“是”的文献被引次数总和 被引频次(CitationCount)=15 答案:跳过第4步的文献是否被引至少一次? N/A 是 “绝对数量(Absolutenumber)”选项,算出至少被引一次文献的数量。
“百分比(Percentage)”选项,用上述“绝对数量(Absolutenumber)”除以“科研产出(ScholarlyOutput)”。
答案:用“被引频次(CitationCount)”除以“科研产出(ScholarlyOutput)” 被引文献数量(CitedPublications)=
3 被引文献数量=75% 篇均被引频次(CitationsperPublication)=3.8 44 Elsevier科研管理解决方案|SciVal Anatomy 文献32005Article
7 InformationSystemsandManagement Medicine DecisionSciences 实体的6篇文献 文献42004Article 9ImmunologyandAllergy Medicine 文献52008Article
0 GeneralMedicine Medicine 文献62010Article 4EmergencyMedicine Medicine 是 否 是 是 是 是 否 是 是 是 是 是 是 是 否 是 是
7 N/A
0 4 是 N/A 否 是 /research-intelligence/scival 45 4.8
指标:施引文献覆盖国家计数(NubmerofCitingCountries) SciVal中的施引文献覆盖国家计数(NubmerofCitingCountries)反映了分析对象文献的区域知名度,即有多少个国家已引用了该分析对象的文献。
施引文献覆盖国家计数(NubmerofCitingCountries)是一个: •引文影响力指标; •体量敏感指标。
SciVal通常情况下以图表来表示历年施引文献覆盖国家计数(NubmerofCitingCountries),年份指文献发表的年份而非被引用的年份。
指标可用于: •对比小规模分析对象,如研究组和文献集合,这时施引文献覆盖国家数量的差异会更明显;•当指标值相对较大时,可以在图表中突出展示一个相对较大的分析对象的表现;•对比分析相关分析对象文献组合的区域知名度,如: -特定研究领域内的合作网络;-研究领域相同、职业发展时长相似的研究人员;-研究机构进行情景模拟:雇佣不同研究人员可能带来的潜在影响力;•通过展现引文来源的区域多样性,证明作品有广泛的区域影响力;•提供透明的底层数据来建立SciVal指标的信任度;•以一种难以被人为操控的方式分析出版行为 指标在以下场合需谨慎使用: •比较大型分析对象,如机构和国家。
这些分析对象发表了大量的文献以至于获得的大量的引用,以至于施引文献覆盖国家计数值没有显著的区分度。
建议用户在使用该指标时运用数据筛选选项,例如研究领域筛选(ResearchAreafilter),将比较范围缩小至大型分析对象的某些特定学科。
•当规模体量有较大差异的分析对象相互比较时,如机构和院系进行比较,此体量相关指标值的不同反应的是分析对象规模不同,而不是区域可见性的区别。
不建议用户使用该指标来比较规模不同的•分析对象。
•对比分析不同学科分析对象的合作关系: -不同的学科,其文献的国际合作模式可能截然不同,例如民族文学与化学,或地方史与计算机科学;-若无法解释上述差异,那么不建议使用该指标来比较不同学科的分析对象;-比较多种学科组成的分析对象(如机构或国家)时,建议用户通过筛选研究领域将分析聚焦于所有分析对 象共有的领域; •了解分析对象所拥有文献的被引数量大小时,建议用户使用期刊计数(JournalCount)或篇均被引频次 46 Elsevier科研管理解决方案|SciVal (CitationsperPublication)等来获取有关信息。
•分析对象规模较小,其文献产出数量与被Scopus收录的文献数量可能存在差异: -此时缺失一篇文献可能对其全球可视性的分析结果产生重大负面影响,当分析对象规模较大时,即使缺失一篇或少数文献分析结果也还是可接受的; -解决这一问题的唯一方法是提高警惕,尤其是分析年轻科研人员等小型分析对象时。
当比较相同学科的较大规模数据集时,这时数据库收录的差异对全部分析对象有相似的影响,此时施引文献覆盖国家计数(NubmerofCitingCountries)这一指标还是可信的。
•调查新策略实施的早期阶段或年轻科研人员的文献表现时,这时根据引用信息来做决定的可靠性将会下降。
这种情况下,建议用户使用期刊计数(JournalCount)或其他无时间相关性的指标。
可用的辅助指标包括: •被引频次(CitationCount)和篇均被引频次(CitationsperPublication),用来获取关于被引数量大小的信息 •文献合作(Collaboration),用于说明分析对象科研产出的合作程度,是对施引文献覆盖国家计数(NubmerofCitingCountries)指标的自然补充,后者提供了影响力的地理分布范围。
•其他“体量敏感指标集(PowerMetrics)”中的指标,这些指标值随着分析对象规模增大而值增,包括:科研产出量(ScholarlyOutput)、期刊计数(JournalCount)、期刊分类计数(JournalCategoryCount)、被引频次(CitationCount)、获得引用的文献数量(CitedPublications,绝对数量)、文献合作(Collaboration,绝对数量)、校企合作(Academic-CorporateCollaboration,绝对数量)、高被引文献量(OutputsinTopPercentiles,绝对数量)、高百分位期刊中的发文量(PublicationsinTopJournalPercentiles,绝对数量)和h指数(h-indices)。
•所有其他“无时间相关性指标”集合,那些基于文献提供及时、实用、可靠的信息,而不会随着时间的推移累加的指标,包括:科研产出量(ScholarlyOutput)、期刊计数(JournalCount)、期刊分类计数 (JournalCategoryCount)、文献合作(Collaboration)、校企合作(Academic-CorporateCollaboration)和高端期刊产出高百分位期刊中的发文量(PublicationsinTopJournalPercentiles)。
/research-intelligence/scival 47 例4:施引文献覆盖国家计数(NubmerofCitingCountries) 实例:用户想要计算分析对象六篇文献的施引文献覆盖国家计数(NubmerofCitingCountries),这些文献分别被文献
A、B、
C、D、E和F所引用,合计6次。
施引文献A施引文献B施引文献C施引文献D施引文献E施引文献
F 文献1是 是是是 文献
2 分析对象的6篇文献 文献
3 文献
4 是 是是 文献5是是是 是 文献
6 是是是 实例:施引文献
A、B、
C、D、E和F有如下的署名信息: 被引文献 作者 机构 文献
A A2 I4 A1 I1 文献
B A3 I4 A3 I2 A1 I1 文献
C A1 I3 A2 I2 文献
D A1 I1 A4 I1 A1 I1 文献
E A3 I5 A5 I1 A1 I1 文献
F A3 I8 A2 I1 国家 C2 C1C2C1 C1C2C1 C1C1 C1C3C1 C1C4C1 问:我该怎样计算施引文献覆盖国家计数(NubmerofCitingCountries)?答:计算施引文献署名信息表中不同国家的数量 施引文献覆盖国家计数(NubmerofCitingCountries)=
4 48 Elsevier科研管理解决方案|SciVal 4.9指标:学科归一化影响力(Field-WeightedCitationImpact) SciVal中的学科归一化影响力(Field-WeightedCitationImpact)是指分析对象文献的被引频次与数据库中其他类似文献的平均被引频次的比较,即分析对象文献的被引频次与全球平均值的比值 •学科归一化影响力(Field-WeightedCitationImpact)为1.00是指分析对象文献的被引频次恰好与根据全球类似文献的平均被引频次相同;“全球”的归一化影响因子或Scopus数据库的归一化影响因子为1.00; •学科归一化影响力(Field-WeightedCitationImpact)大于1.00是指分析对象文献的被引频次多于根据全球类似文献的平均被引频次而得出的预期数量;例如,2.11意味着被引频次比全球平均值多111%; •学科归一化影响力(Field-WeightedCitationImpact)小于1.00是指分析对象文献的被引频次少于根据全球类似文献的平均被引频次而得出的预期数量;例如,0.87意味着被引频次比全球平均值少13%。
类似文献是指Scopus数据库中发表年份相同、文献类型相同、学科(如Scopus期刊分类)相同的文献:•SciVal中的文献根据以下两种分类系统进行划分: -“期刊分类”划分方式:假设某期刊的每个文献都属于同一学科,每篇文献自动划分到所在期刊所分配的学科分类。
这种划分方式适用于那些专注于核心领域的期刊,它们不刊载同属于其他领域的文献; -“文献级别的分类”划分方式:假设期刊刊载的文献可能与期刊所专注的核心领域无关,而与其他领域相关。
文献级别的分类划分方式可将期刊中的单篇文献划分为其它相关类别;这对那些多学科期刊中的文献至关重要; •学科归一化影响力(Field-WeightedCitationImpact)采用“文献级别的分类”划分方式; •文献按照子学科划分,并且可以划分到多个子学科中。
计算类似文献的预期被引频次时,多学科的文献不能重复加权,这点至关重要。
例如,如果文献P既属于寄生生物学又属于微生物学,计算P在其中一个子学科的影响力时,不可以重复计算影响力。
SciVal会根据文献所属的多个学科类别平均划分文献和被引频次;如文献P按照0.5篇寄生生物学文献和0.5篇微生物学文献计算,其被引数量也由两个子学科所平均。
学科归一化影响力(Field-WeightedCitationImpact)是一个: •引文影响力指标 •雪球指标 SciVal通常情况下以图表来表现历年学科归一化影响力(Field-WeightedCitationImpact),年份是指文献发表的年份而非被引用的年份,被引频次指文献发表当年及随后三年所累积获得的被引次数总和。
该指标可用于: •对比分析不同分析对象,无论其规模、学科、出版时间、及文献类型构成是怎样的,如: -一个研究机构和该机构内的各个院系部门(研究小组);-一个国家和该国的研究机构;-一个地理区域和该地区的各个国家; /research-intelligence/scival 49 •通过观察学科归一化影响力(Field-WeightedCitationImpact)高于或低于全球平均水平1.00的程度,可方便地了解分析对象文献引用影响力方面的声誉; •由于考虑了近期发表文献累计获得引用较低的情况,由此学科归一化影响力(Field-WeightedCitationImpact)避免了被引频次(CitationCount)和篇均被引频次(CitationsperPublication)指标中会出现的近几年趋势下滑的曲线; •在Scopus数据库中收录不够完全的学科中,了解分析对象文献的被引表现,因为数据库收录范围的差异对分析对象文献和类似文献都有同样的影响,因此学科归一化影响力(Field-WeightedCitationImpact)值不受Scopus数据收录范围的影响; •可以作为观察引用数据的默认指标,因为该指标考虑了到影响其他影响力指标的多个因素; •以一种难以被人为操控的方式分析出版行为。
指标在以下场合需谨慎使用: •当分析对象文献被引数量大小的信息对分析目标至关重要时;在这种情况下,建议用户使用被引频次(CitationCount)或篇均被引频次(CitationsperPublication)等指标; •向更喜欢看到高数值的人展示优异表现时;在这种情况下,被引频次(CitationCount)或篇均被引频次(CitationsperPublication)指标会更适合; •分析对象规模较小,导致指标会随着时间的推移剧烈波动状态不稳定时,虽然Scopus收录范围已经十分广泛、全面,但是学科归一化影响力(Field-WeightedCitationImpact)计算的是平均值,而小数据集中的无关文献仍会极大地影响计算结果; •需要建立对SciVal指标的信任;本指标的计算涉及了多项因素的归一化处理,另外计算类似似文献的平均被引频次需要遍历Scopus数据库所有的数据,导致用户对指标的计算很难进行验证。
如果用户需要建立对SciVal指标计算准确性的完全信任并实现可自行验证,那么建议用户选择更简单的影响力指标,如被引频次 (CitationCount)或篇均被引频次(CitationsperPublication); •研究新策略实施的早期阶段或年轻科研人员的文献表现,这时根据引用信息来做决定的可靠性将会下降。
这种情况下,建议用户使用无时间相关性的指标,如校企合作(Academic-CorporateCollaboration); •彻底回答所有与表现相关的问题,学科归一化影响力(Field-WeightedCitationImpact)是个非常有用的指标,但仅仅运用该指标而排除其他指标则会限制用户从SciVal中得到的丰富又可靠的信息。
可用的辅助指标包括: •被引频次(CitationCount)和篇均被引频次(CitationsperPublication),该两个指标反映了被引频次数量的大小,是学科归一化影响力(Field-WeightedCitationImpact)指标的自然补充。
另外,上述指标简单易懂,数据和计算过程透明,用户可以自行验证从而建立对SciVal指标计算的信任; •无时间性的指标,可以立即提供文献有用的可靠信息,而不依靠时间来累积有效信息,包括:科研产出 50 Elsevier科研管理解决方案|SciVal (Scholar
声明:
该资讯来自于互联网网友发布,如有侵犯您的权益请联系我们。