基于分段线性模型的科研项目论文产出评价研究
——以杰青基金地球科学项目为例

田人合1,2,张志强1,高 志3

(1.中国科学院 成都文献情报中心,四川 成都 610041;2.中国科学院大学,北京 100049;3.天津城建大学 图书馆,天津 300384)

以1994—2013年杰青基金地学项目为研究对象,首先,建立科研论文发表量和顶级期刊论文发表量评价指标,衡量科研成果产出能力和创新性科研成果产出能力;其次,引入“科技期刊收录膨胀率”消除因WOS中SCI和SSCI收录期刊增加对科技论文带来的放大式增长;最后,通过构建分段线性回归模型对杰青科学家科研论文发表量和顶级期刊论文发表量进行分析。结果表明,杰青基金资助后,66.5%的杰青科学家科研论文发表量和顶级期刊论文发表量都得到了提高,21.6%的杰青科学家只提高了科研论文发表量,7%的杰青科学家只提高了顶级期刊论文发表量,4.8%的杰青科学家科研论文发表量和顶级期刊论文发表量均未提高。最后,结合已有杰青科学家访谈资料,从科研环境、激励、考评机制等角度对造成上述结果的可能原因进行分析。

关键词科研成果产出能力;创新性科研成果产出能力;国家杰出青年科学基金;科技政策评价

0 引言

科研项目是开展科学研究工作的物质基础,对提高科研产出创新性和科技人才竞争力有非常重要的作用,因而受科研人员和科技政策制定者日益重视。与之相应的是,政府和科研机构对各科研项目资助力度逐渐加大[1],甚至通过对创新性很高的科研产出作者或机构给予高额奖赏,以激励科研人员积极从事创新性工作[2],从而得到更多、更具创新性的科研产出。这些科研产出大致可以分为新知识、高质量的人力资源及新技术3种类型[1-3]。目前,尽管没有直接方法衡量这些科研产出,但已有研究[1-5]通过使用替代指标衡量科研产出,如科研论文全部论文产量、科研论文被引频次和获得博士学位的人数等。定量分析上述科研项目的替代指标,能够客观评价科研项目对受资助者全部科研论文发表量和顶级期刊论文发表量的作用,既是受资助科学家也是科研项目资助者关注的内容,具有重要价值。

已有科研项目评价研究按照评价对象可分为3层:①微观层面,主要是指研究者个体、研究小组及某个研究项目等;②中观层面,主要是指研究机构,如研究所、大学、公司,以及研究计划和学科领域等;③宏观层面,主要是指国家(地区和部门)、区域和国际性组织。本研究对象为具体科研项目资助科学家,定义为微观层面。微观层面的国外相关研究中,Jose[1]通过使用断点回归方法对智利FONDECYT基金进行评估分析,发现相比对照组,FONDECYT基金对资助者科研论文产出数量有极大的促进作用。Ashish[4]研究NSF资助与科研人员科研论文产出之间的关系,发现NSF基金对经济学家早期成长的促进作用更为明显,每增加1万美元资助给受资助者,可增加12篇论文产出。David[6]以OECD1991-2011年15个国家的研发投入数据及WOS产出数据为研究对象,发现每100万美元的公共研发投入可以为投入国带来1-2篇论文产出。Pierre[7]以美国NIH基金为研究对象,研究该基金资助对专利和全部论文产量的影响,发现NIH基金对私人专利产出更具促进作用,每1 000万美元的资助增长带来2.3个专利数量增长。国内相关研究基本上集中于NSFC项目,评价指标包括国际论文、国内论文及问卷调查。其中,史晓敏[8]研究发现,杰青基金项目文章在发表后3、4年的被引频次高于重点项目。胡平[9]研究发现,杰青基金资助成果存在不均衡性和差异性。周萍[10]研究发现,国家自然科学基金项目在中文论文发表方面占绝对领先地位。

上述研究的特点是:①国外研究大都采用计量经济学模型,以不同科研项目为对照作横向对比分析,未对科研项目实施前后进行纵向对比;②国内研究采用统计方法,通过计算发文数量、被引频次评价科研项目的科研产出数量和质量。但国内研究以不同科研项目为对照组进行横向对比,未对科研项目实施前后进行纵向对比;③所有研究都以项目受资助者整体为研究对象,以全部论文产量的平均值为衡量指标,得到的结论也是项目资助对整个受资助群体论文产出绩效,并未考虑科研项目对受资助个体资助效果的多样性。鉴于此,本文主要解决如下问题:①科研项目实施前后科学家全部科研论文发表量和顶级期刊论文发表量均得到提高的人数比例是多少?或者全部科研论文发表量和顶级期刊论文发表量分别得到提高的比例是多少?②造成上述结果的可能原因是什么?已有研究将分段线性回归模型应用于分析获得终身教授前后计算机学科科学家科研产出变化情况,基于此,本研究尝试构建分段线性回归模型回答这一问题,结合科学家访谈对可能的原因进行探析。

1 实证对象与概念界定

1.1 实证对象

本研究获得国家自然科学基金委(以下简称“NSFC”)地球科学部的支持,以国家杰出青年科学基金(以下简称杰青基金)地球科学部项目(以下简称“地学”)为研究对象。杰青基金设立于1994年[11],截至2013年,共实施20年,资助3 004人,资助总额共44.1亿元,资助期限(以下简称“资助期”)从开始的3年延长到4年,范围涵盖8个学科领域。其中,地学杰青获得者(又称“杰青科学家”)共311人,占获资助总人数的10.35%。

1.2 概念界定

1.2.1 基本概念界定

全部科研论文发表量(以下简称“全部论文产量”):科学家从发表第一篇SCI和SSCI(本文也称论文)开始到检索截止日期为止发表的所有论文。借鉴已有研究中科研成果产出能力测度指标[12],定义杰青科学家每年发表的论文数量为科学家科研成果产出能力衡量指标;顶级期刊论文发表量(以下简称“顶级期刊论文产量”):Azoulav[13]使用Top1%期刊论文作为创新性科研成果产出能力测度指标。借鉴该思路,定义科学家在其所在学科顶级期刊上发表论文的数量为衡量该杰青科学家创新性科研成果产出能力的评价指标。顶级期刊选择范围为中国科学院文献情报中心确定的中科院分区表中的2015年Top期刊[14],该分区的优点在于经过定量分析和同行评议产生,在科学共同体内有很高的认可度。

1.2.2 时间序列相关概念

本研究涉及两种时间序列:①杰青基金实施历史时间序列,即1994—2013年杰青基金实施的20年历史周期;②杰青科学家产出时间序列,即每位杰青科学家年度论文产出数值。因杰青科学家获得资助的时间不同,建模分析时对产出时间序列进行中心化处理,即以杰青基金资助当年的时间为0点,资助时间往后1年,时间轴上的数字递加1;资助时间往前1年,时间轴上的数据递减1。

2 研究数据及实证模型

2.1 数据准备

经过检索、对照、筛选和整理等工作构建以下3个数据集:

(1)数据集一为1994-2013年地学部全部311名杰青科学家的基本信息及产出信息,其中4人因资助撤销、资助中去世、出国未归等原因未纳入统计,实际分析对象为307人。

(2)数据集二为每位杰青科学家的全部产出数据。数据集的整理主要考虑两个方面的要求:①Moed H F[15]对文献计量方法在评价中国研究活动中的应用进行了梳理,提出基于国际视野对中国相关领域进行评估应该以国际性数据库Institute for Science Information(ISI)提供的数据为对象进行分析;②地理学二级学科中人文地理学科研成果以SSCI为主,因此对人文地理学专业的杰青科学家产出(2人)以SSCI为主,其他杰青科学家产出以SCI为主。基于此,研究采用“姓名+机构”的条件组合从Web of Science(WOS)核心数据库中获取论文数据,检索截至2015年5月31日。对检索结果经甄别和筛选后最终确定全部产出数据31 098篇。

(3)数据集三为杰青基金产出数据集。汤森路透公司从2008年8月开始收录基金资助号信息[16],因此,1994—2013年杰青基金产出分3部分整理:第一部分对1994-2002年杰青基金产出采用全文下载、逐一判读、结题报告核对及杰青基金号检索三者相结合的方式进行;第二部分对2003-2007年杰青科学家采用以杰青基金资助号检索为主,结题报告核对为辅的方式进行;第三部分对2008-2013年杰青科学家采用基金资助号检索方式得到杰青基金产出。最终确定杰青基金产出论文4 712篇。

2.2 实证模型与方法

在回归分析中,被解释变量的影响因素除了量(或定量)的因素还有质(或定性)的因素,这些定性因素可能会使回归模型中的参数发生变化,为了估计定性变量产生的影响,在模型中引入虚拟变量。经济计量分析中的政策因素、心理因素,经济增长分析中的季节因素、消费习惯因素等都是影响模型的定性因素[17, 18]

2.2.1 分段线性回归模型

Samuel F Way[19]以是否获得终身教职作为虚拟变量构建分段线性回归模型,实现对获得终身教职这一定性因素的“量化”处理,分析获得终身教职前后科研人员产出时间序列变化规律。本研究以杰青基金资助的0点为杰青政策干预起点,以是否获得杰青基金资助作为虚拟变量对杰青科研产出构建分段线性回归模型,并对杰青基金这一政策因素进行“量化”处理,模型方程如下:

f(t)=b1+k1t+k2(t-t*I(t>t*)

(1)

式 (1)中,t*是获得杰青基金资助的时刻,t*前后反映了0点前后论文产出变化。b1是产出初始值,式(1)中I(t>t*)为示性函数,当t<t*时,无杰青基金资助,I(t>t*)=0,式(1)等价于式(2)。其中k1表示分段线性回归模型中t<t*前回归直线的斜率,反映了0点前杰青科学家首次产出到0点的变化情况。

f(t)=b1+k1t

(2)

当t>t*时,开始杰青基金资助,I(t>t*)=1,式(1)等价于式(3),其中,k1+k2表示分段线性回归模型中t>t*时回归直线的斜率,反映了0点后杰青产出的变化情况。

f(t)=b1+(k1+k2)t

(3)

对t*前后的回归线段斜率作如下比较:①若k1>k1+k2>0,表明0点前后呈现上升趋势,但0点前上升幅度大于0点后,即杰青基金资助后杰青科学家科研产出不升反降;②若k1+k2> k1>0,表明0点前后呈现上升趋势,但0点前上升幅度小于0点后;③若k1<0,k1+k2>0,则k1+k2> k1,表明0点前呈下降趋势,0点后呈上升趋势;④若k1>0,k1+k2<0,则k1+k2< k1,表明0点前呈上升趋势,0点后呈下降趋势;⑤若k1<0,k1+k2<0,表明0点前后均呈下降趋势。

2.2.2 整体研究思路

本文整体研究思路见图1,具体步骤为:①数据准备;②实证分析:首先,对因WOS中收录SCI和SSCI期刊数量增长带来的科技论文放大式增长进行消除。其次,根据分段线性回归模型对307名杰青科学家科研产出进行实证分析,得到m个全部论文产量规律。最后,根据m个产出规律将307名杰青科学家分成m个群体,对m个科学家群体在顶级期刊上发表的论文数量进行实证分析,得到n个顶级期刊论文产量规律;③结论与讨论:将m个全部论文产量规律和n个顶级期刊论文产量规律组合后,得到m*n个全部论文产量和顶级期刊论文产量规律组合,即m*n个结论,结合访谈研究对m*n个结论的可能原因进行讨论。

3 实证分析

3.1 科技期刊收录膨胀率消除

3.1.1 科技期刊收录膨胀

Peder[20]&Eric[21]研究发现,科技期刊数量随时间推移而增加;Garfield[22]研究整理出1964年和1972年SCI收录的期刊数量分别是600种和2 400种;Zitt[23]研究发现,1997年SCI收录的期刊数量为5 471种;Peder[20]整理了1997—2009年SCI和SSCI收录的期刊数量。本研究利用JCR查询[24]得到1997—2015年SCI和SSCI期刊收录数量,并从Clarivate Analytics技术服务部获取了SCI、SSCI、AHCI和WOS核心合集每年收录期刊数量。综上,得到 SCI、SSCI、AHCI和WOS核心合集每年收录期刊数量(如图2所示),需要说明的是,对SCI和SSCI中的重复期刊作消除处理。

SCI期刊收录数量见图2(A),从1964年的600种增加到2015年的8 769种,51年间增加了8 169种,平均每年增加160种期刊。每年增长率见图3(A),1986、1987、2014、2015四年呈负增长,1988、1989两年呈零增长,其余26年均呈正增长。SSCI期刊收录数量见图2(B),从1980年的1 442种增加到2015年的3 208种,平均每年增加51种期刊。每年增长率见图3(B),1981—1992年增长率极低,稳定在1 442~1 448之间。2013—2015年收录期刊数量再无增加,最终稳定在3 208种。杰青科学家发表论文不涉及AHCI期刊收录论文,此处列举是为了说明WOS整体收录期刊数量变化,WOS的核心合集由SCI、SSCI和AHCI组成,由图2(D)和图3(D)可知,WOS收录期刊数量经过1981—1984年、1993—2000年、2004—2012年3个阶段增长,数量从1980年的6 136种增长到2015年的12 578种,平均每年增加201种期刊。

图1 整体研究思路

图2 WOS中各数据库(A-C)及WOS核心合集(D)收录期刊年度分布

3.1.2 科技期刊收录膨胀因素消除

经济学和心理学中有累计效应(cumulative effect)的概念,其中乘数理论指出,单位自发性支出增加会引起支出连锁增加,从而使总产出以一种放大形式增加。地学部杰青科学家从1994到2013年时间跨度为整20年,科研产出从1984到2015年时间跨度为整31年。期间,杰青科学家论文产出数量因期刊收录数量增加而以一种放大形式增加。本研究分析自杰青基金实施20年以来,杰青科学家获得资助前后全部论文产量及顶级期刊论文产量变化情况。在如此长的时间序列里,只有去除这种放大因素,才能客观评价杰青基金实施绩效。鉴于此,本文提出科技期刊收录膨胀率,即科技期刊随时间推移而增加的情况。杰青科学家科研产出从1984年到2015年,SCI收录期刊数量经过3个阶段增长,从4 447种增加到8 769种(见图2(A)),平均每年期刊增长139种(见图2(A))。涉及SSCI产出的两位人文地理学杰青科学家,分别在2000年和2004年获得杰青基金资助,SSCI期刊数量也处于增长阶段(见图2(B))。因此,如何消除因期刊收录数量增加而导致的论文数量增加是本研究面临的首要问题。

针对这一问题,Samuel[19]提出,借鉴经济学中消除通货膨胀的方法消除科技期刊收录膨胀因素。本文采用Samuel提出的方法消除SCI和SSCI期刊收录膨胀因素,最终得到科技期刊膨胀消除产出(inflation-adjusted publications)。科技期刊收录膨胀率消除前后(简称:“膨胀处理前后”)各产出类型对比如图4所示。由图4(A)、图4(B)、图4(C)可知,膨胀处理后的产出数据消除了因科技期刊膨胀率导致的科研产出“虚假”增长。

3.2 全部科研论文发表量分析

在前文数据的基础上,对307名杰青科学家在0点前后的产出逐一作分段线性回归。首先需要确定0点前后线性回归时间范围,将首次产出时间点到0点确定为资助前回归分析时间段,对于0点后的时间范围,根据已有研究结果[25, 26],以及所有结题报告中所列“关于填写《国家自然科学基金资助项目结题报告》的说明”第四条:“自然科学基金委负责跟踪和管理结题项目的成果,根据情况在2~3年后对项目执行情况进行评估。请项目负责人在结题后3年内继续提供项目研究后期正式发表并获公布的成果,一并存档并作为项目管理和评估的依据”,结合结题报告中关于经费支出及科研进展的陈述,认定杰青基金经费在资助结束后2年内仍然为后续科研服务。因此,资助持续期和产出集中在0点之后的6年时间内。综合分析,选择0点为虚拟变量引入点,0点以后的6年为杰青基金资助持续期(简称“资助持续期”)。

图3 WOS各数据库(A-C)及WOS核心合集(D)收集期刊数量年度增长率

分段线性回归后得到每名杰青科学家对应的k1和k2,分布结果见图5。图5包括分布在3个象限(第三象限无散点分布)的散点图(简称“散点图”)和折线图。散点图中,横轴k1表示资助前产出时间序列线性拟合趋势线的斜率,纵轴k1+k2表示资助持续期内产出时间序列线性拟合趋势线的斜率,两条轴线将整个区域分割为4个象限(从右上角开始逆时针旋转依次记为:第一象限、第二象限、第三象限、第四象限),每个象限对应一个折线图(从右上角开始逆时针旋转,每个象限的折线图依次记为:折线图1、折线图2、折线图3、折线图4)。每个象限中,2009年以前的(散点图中标注为2009年以前杰青科学家)杰青科学家人数记为N。标注有k1=k1+k2的斜线将第一象限分割为上下两部分,每部分杰青科学家人数分别记为N1和N2。因资助持续期为6年,2010—2013年80名杰青科学家不满足此条件,此处不作分析。1994—2009年的227名杰青科学家满足此条件,故实际可分析的科学家为2009年以前的杰青科学家,分析后的散点图结果如图5所示。折线图1-3中绘制的两条折线分别是全部产出(折线图中实心圆点加虚线)和杰青基金产出(折线图中菱形空心点加虚线),对折线分段线拟合后绘制趋势线(两条连接的粗线段),后文分象限详细陈述。

(1)第一象限。参数位于该象限的杰青科学家共195名,参数k1>0且k1+k2>0表示t*前后全部产出均呈上升趋势。k1=k1+k2标注的斜线(第一象限中右上方标注有k1=k1+k2的虚线段)将第一象限分割为上下两部分(第一象限上侧和下侧),第一象限上侧(k1<|k1+k2|)共180名杰青科学家(Ⅰ-1类杰青科学家),所占比例为79.3%,表示t*前后全部产出均呈上升趋势,且t*前上升趋势大于t*后,表示杰青基金能够提升全部论文产量。第一象限下侧(k1>|k1+k2|)共15名杰青科学家(记为Ⅰ-2类杰青科学家),所占比例为8.6%,表示t*前后全部产出均呈上升趋势,但t*前上升趋势小于t*后,表示杰青基金不能提升全部论文产量。选取该区域一名杰青科学家绘制全部产出时间序列及趋势拟合线段,如图5第一象限所示。图中t*=3,t*前线段斜率小于t*,故杰青基金对该杰青科学家全部论文产量有提升作用。从散点分布情况看,k1越小(散点在k1正半轴方向越靠近0点),k1+k2越大(散点在k1+k2正半轴方向越远离原点),k1越小于k1+k2,t*前后产出斜率变化就越大,即全部论文产量变化越大,表示杰青基金对全部论文产量的提升幅度越大。从散点密集程度角度看,绝大多数散点集中在0<k1<1,0<k1+k2<5的矩形区域。因此,杰青基金对绝大多数杰青科学家全部论文产量有提升作用,且提升幅度非常大。

(2)第二象限。参数位于该象限的杰青科学家共20名(Ⅱ类杰青科学家),所占比例为8.8%。该象限中参数k1<0<k1+k2,即该象限杰青科学家在t*前呈下降趋势,t*后呈上升趋势,杰青基金能提升这20名杰青科学家的全部论文产量。选取该区域一名杰青科学家绘制全部产出时间序列及趋势拟合线段,如折线图5第二象限所示,图中转折点t*=1,分段拟合线段的斜率在t*前呈下降趋势,t*点后呈上升趋势,即杰青基金对该杰青科学家全部论文产量有提升作用。从散点分布可知,20名杰青科学家参数点都集中在|k1|<0.5,|k1+k2|<3的矩形区域内,说明20名杰青科学家在t*前全部论文产量下降缓慢,t*后全部论文产量上升较快。|k1|值越大(k1轴负半轴越远离0点),k1+k2值越大(k1+k2轴正半轴方向越远离0点),即t*前全部产出下降幅度越大,t*后全部产出上升幅度越大,杰青基金对全部论文产量的提升幅度就越大,由图中散点分布可知,这样的点很少。

图4 期刊收录数量膨胀处理前后年度各项产出(A-C)数量分布

图5 杰青科学家全部论文产量评价参数分布

(3)第三象限。第三象限中参数k1<0且k1+k2<0,表示该区域杰青科学家全部论文产量在t*前呈下降趋势,t*后仍然呈下降趋势。参数位于该区域的杰青科学家数量为零,表示不存在t*前全部论文产量持续下降,t*后全部论文产量仍然下降的杰青科学家。

(4)第四象限。参数位于该象限的杰青科学家共12名(Ⅳ类杰青科学家),所占比例为5.3%。该区域参数k1>0且k1+k2<0,即k1>k1+k2,即杰青基金产出t*前呈上升趋势始终大于t*后,表示杰青基金没有提升该部分杰青科学家全部论文产量。选取该区域一名杰青科学家绘制全部产出时间序列及趋势拟合线段,如图5第四象限所示,图中转折点t*=0,分段拟合线段的斜率在t*前呈上升趋势,t*点后呈下降趋势,杰青基金对该杰青科学家全部论文产量有提升作用。k1值越小(k1轴正半轴方向越靠近0点),t*前产出斜率上升越小,|k1+k2|的值越大(k1+k2负半轴方向越靠近0点),t*后产出斜率下降幅度就越大。从散点分散程度看,绝大多数散点集中在0<k1<2,-3<k1+k2<0的矩形区域,即该区域杰青科学家在t*前全部论文产量逐步提升,但提升幅度很小,t*后全部论文产量逐渐降低,降低幅度较小。

3.3 顶级期刊论文发表量分析

通过全部论文产量实证分析得到第一象限上侧、第一象限下侧、第二象限和第四象限共4个全部论文产量规律,这4个全部论文产量规律可以将所有杰青科学家划分为4个群体,将具有第一象限上侧和下侧全部论文产量规律的科学家分别记为Ⅰ-1类和Ⅰ-2类杰青科学家群体,将具有第二、三、四象限全部论文产量的杰青科学家记为Ⅱ类、Ⅲ类(0人)、Ⅳ类杰青科学家群体,分别对Ⅰ-1类、Ⅰ-2类、Ⅱ类和Ⅳ类杰青科学家群体作顶级期刊论文产量实证分析。

(1)Ⅰ-1类杰青科学家群体。Ⅰ-1类杰青科学家顶级期刊论文发表量分段线性拟合结果见图6。其中,第一象限上侧78人,第二象限58人,k1+k2上半轴5人,共计141人,占全部分析杰青科学家的62.1%,这部分杰青科学家t*前后|k1|<|k1+k2|,即杰青基金对顶级期刊论文产量有提升作用。第一象限下侧16人,第三象限0人,第四象限7人,k1轴右半轴1人,共计24人,这部分杰青科学家t*前后|k1|>|k1+k2|,即杰青基金对顶级期刊论文产量没有提升作用。参数位于原点处的杰青科学家共15人,这部分杰青t*前后|k1|=|k1+k2|,即t*前后均无顶级产出,杰青基金对这部分杰青科学家顶级期刊论文产量同样没有提升作用。

(2)Ⅰ-2类杰青科学家群体。Ⅰ-2类杰青科学家顶级期刊论文发表量分段线性拟合结果见图7。其中,第一象限上侧12人,第二象限2人,共14人,这部分杰青科学家t*前后|k1|<|k1+k2|,即杰青基金对顶级期刊论文产量有提升作用。第一象限下侧0人,第三象限0人,第四象限1人,共1人,这部分杰青科学家t*前后|k1|>|k1+k2|,即杰青基金对顶级期刊论文产量没有提升作用。

(3)Ⅱ类杰青科学家群体。Ⅱ类杰青科学家顶级期刊论文发表量分段线性拟合结果见图8。其中,第一象限上侧8人,第二象限杰青科学家为6人,共计14人,这部分杰青科学家t*前后|k1|<|k1+k2|,即杰青基金对顶级期刊论文产量有提升作用。第一象限下侧1人,第四象限1人,共计2人,这部分杰青科学家t*前后|k1|>|k1+k2|,即杰青基金对顶级期刊论文产量没有提升作用。参数位于原点处的杰青科学家共4人,这部分杰青t*前后顶级产出全部为零,|k1|=|k1+k2|,即杰青基金对顶级期刊论文产量同样没有提升作用。

图6-1类杰青科学家群体顶级期刊论文产量评价参数分布

图7-2类杰青科学家群体顶级期刊论文产量评价参数分布

图8类杰青科学家群体顶级期刊论文产量评价参数分布

(4)Ⅳ类杰青科学家群体。Ⅳ类杰青科学家顶级产出的分段线性拟合结果见图9。其中,第一象限上侧1人,第二象限1人,k1+k2轴上半轴1人,共3人,这部分杰青科学家t*前后|k1|<|k1+k2|,即杰青基金对顶级期刊论文产量有提升作用。第四象限杰青科学家7人,这部分杰青科学家t*前后|k1|>|k1+k2|,即杰青基金对顶级期刊论文产量没有提升作用。参数位于原点处的杰青科学家共2人,这部分杰青科学家t*前后顶级产出全部为零,且|k1|=|k1+k2|,即杰青基金对这部分杰青科学家顶级期刊论文产量同样没有提升作用。

3.4 实证结果总结

综合前文实证分析结果,整理得到杰青科学家全部论文产量和顶级期刊论文产量在各象限和坐标轴的分布情况见表1。表1中第一行表示全部论文产量在各个象限的实证结果,第一列表示顶级期刊论文产量在各个象限、坐标轴及原点的实证结果,第i行第j列中表示的杰青科学家人数记为Nij

图9类杰青科学家群体顶级期刊论文产量评价参数分布

表1 全部产出与顶级产出参数杰青科学家人数分布

顶级期刊论文产量/全部论文产量Ⅰ-1类杰青科学家群体Ⅱ类杰青科学家群体Ⅰ-2类杰青科学家群体Ⅳ类杰青科学家群体第一象限上侧788121第二象限58621K1+K2轴上半轴1000第一象限下侧16100第三象限0000第四象限7117原点15402K1轴右半轴5001

通过实证分析模型中k1和k1+k2的大小关系,可以判断全部论文产量和顶级期刊论文产量在0点前后的变化情况,从而判断出杰青科学家全部论文产量和顶级期刊论文产量在0点前后是否得到提高。通过排列组合得到结果判断标准见表2。根据表2的判断标准对表1中杰青科学家进行归类,①组合1:符合表2中组合1条件的杰青科学家是全部论文产量位于I-1类及Ⅱ类的杰青科学家群体,顶级期刊论文产量参数位于第一象限上侧、第二象限及k1+k2轴上半轴,对应表1中第1~3行、第2~3列共151名杰青科学家,占全部杰青科学家(1994-2009年227人,以下也用该总数)的66.5%;②组合2:符合表2中组合2条件的杰青科学家是全部论文产量位于I-1类及Ⅱ类的杰青科学家群体,顶级期刊论文产量参数位于第一象限下侧、第三象限、第四象限、原点及k1右半轴,对应表1中第4~8行、第2~3列共49名杰青科学家,占全部杰青科学家的21.6%;③组合3:符合表2中组合3条件的杰青科学家是全部论文产量参数位于I-2类及Ⅳ类杰青科学家群体,顶级期刊论文产量参数位于第一象限上侧、第二象限及k1+k2轴上半轴,对应表1中第1~3行、第4~6列共16名杰青科学家,占全部杰青科学家的7%;④组合4:符合表2中组合4条件的杰青科学家是全部论文产量参数位于I-2类、Ⅲ类及Ⅳ类的杰青科学家群体,顶级期刊论文产量参数位于第一象限下侧、第三象限及第四象限,对应表1中第4~8行、第4~5列共11名杰青科学家,占全部杰青科学家的4.8%。

表2 全部论文产量与顶级期刊论文产量规律组合及成立条件

提高顶级期刊论文产量未提高顶级期刊论文产量提高全部论文产量组合1:全部论文产量中k1<k1+k2,且顶级期刊论文产量中k1<k1+k2组合2:全部论文产量中k1<k1+k2,且顶级期刊论文产量中k1≥k1+k2未提高全部论文产量组合3:全部论文产量中k1≥k1+k2,且顶级期刊论文产量中k1<k1+k2组合4:全部论文产量中k1≥k1+k2,且顶级期刊论文产量中k1≥k1+k2

4 结论与讨论

首先,与既往研究采用不同基金间的横向对比不同[6, 7],本研究对杰青基金实施前后进行纵向对比。其次,本研究使用科技期刊收录膨胀率消除科研产出在20年时间序列上的放大式增长,使研究结论更加客观。最后,与以往研究使用一定数量科学家的平均科研产出作为评价指标不同[8-10],本研究通过分段线性回归,采用杰青科学家年度全部论文发表量及年度顶级期刊发文量评价每位科学家产出。基于此,本文共得到4个研究结论。在陈述研究结论的同时,对结论产生的可能原因进行探析,本文分析了已有杰青科学家的访谈研究和质性研究论文共6篇,按照论文发表时间顺序为文献1~6[27-32],如表3所示。

表3 杰青科学家质性研究主要文献

内容 文献1 文献2 文献3 文献4 文献5 文献6文献类型研究报告期刊论文硕士学位论文硕士学位论文硕士学位论文硕士学位论文发表时间2001.82011.32011.62014.52016.52016.6作者姓名Cong Gao and Rich-ard赵雷高祀会万懿张烨张瑜作者机构Columbia University北京师范大学哈尔滨工程大学中科院心理所东南大学山西医科大学作者专业Sociology心理学教育经济与管理应用心理学图书情报与档案管理医学科技管理研究方法半开放式访谈法半开放式访谈法直接询问+深度访谈访谈法杰青履历研究法文献研究法研究对象人数52人25人6人研究对象282人,实际访谈13人91人99人研究对象所在单位众多高校和研究所未明确说明哈尔滨工业大学4名杰青,2名海外杰青合作者;哈尔滨工程大学20人,4名杰青基金曾经申报者,其他为教授、副教授、博士大学5人,科研机构8人6种工作机构北京大学、复旦大学、第四军医大学研究对象学科分布生命科学、地学和技术科学信息学部4人、化学学部3人、地球科学部5人、生命科学部3人、管理学部5人、数理学部3人、材料学部2人4名杰青科学家分属不同的学院和专业,具体情况未详细说明1994-2011年生命科学领域1994-2013年管理学部杰青科学家1994-2014年生物医学领域研究总结通过访谈,对研究环境和杰青科学家的成长进行分析,探讨中国科学的未来发展研究杰青科学家成长情况,分析影响青年创新人才的发展的影响因素如何提供科学合理的环境,从而促进青年科学家成功获得杰青基金资助探讨杰青科学家个体成长和科研环境对其科研产出的影响研究管理学部杰青科学家成长特征,并结合科研环境等进行解释研究杰青科学家的科研产出情况,并从科研环境等角度继续解释

为了提取相关资料,本文对原文中被访谈科学家的语句进行梳理,将杰青科学家普遍认为影响自身创造的关键因素按重要性归纳为:外部环境(科研、社会及生活环境)、重要他人(师长、领导、亲人等)以及自身因素(科研思想和个性能力)。综上,对本文研究结论及得出上述结论的可能原因陈述如下:

(1)全部论文产量和顶级期刊论文产量均得到提升的杰青科学家共151名,占全部杰青科学家人数的66.5%。造成这一比例的可能原因是:杰青基金作为人才资助项目用以资助杰青科学家进行自主选题,可以激励科学家研究更加具有挑战性的问题。如受访杰青科学家A指出:“获得杰青基金,本身就意味着领导和同行的认可”[27, 29]。获得杰青基金的科学家从依托单位获得更多配套经费、科研自主权和住房等其它福利,在这种环境下,科学家没有任何后顾之忧,唯一的科研动机就是产出高水平研究成果。

(2)全部论文产量得到提高,顶级期刊论文产量没有提高的杰青科学家共49名,占全部杰青科学家人数的21.6%。造成这一比例的可能原因是:当前考评机制存在行政干预和急功近利,如针对行政干预受访的杰青科学家B指出:“有些领导只在乎自己在位的过程,只关注自己,所以一定要短期的收益,不搞持续”[28-30];针对考评机制的急功近利,受访的杰青科学家C指出:“现有的评价体系,如果没有文章,没有相应的成果,在基金申请或往更高层次走,甚至继续在原单位工作,都变得困难”[30],并提到“有深度的工作,特别是原创的工作,需要很长时间的积累,急功近利的考核制度阻碍工作创新,导致“短平快”的研究”[28-30]。在这种科研环境下,杰青科学家会选择从事较为简单的选题,或者继续在自己已有研究领域耕耘,不去开辟新的创新性更高的研究领域。

(3)全部论文产量没有得到提高,顶级期刊论文产量得到提高的杰青科学家共16名,占全部杰青科学家人数的7%。造成这一比例的可能原因是:众多杰青科学家受访者认为杰青基金的品牌非常有分量,并认为,很多科学家获得过很多国家级科研项目和奖项,就差杰青基金一项[30]。因此,获得杰青基金的科学家,已无需申请更多项目,这种科研环境能避免杰青科学家只追求论文数量而轻创新性,或者忙于申请更多科研项目而无法集中精力从事高水平研究。这种科研环境下杰青科学家的科研动机是开辟更有创新性的研究领域或者将已从事的研究钻研得更深入,又或者选择难度更高的科研选题,总之不再是简单地追求论文数量,而是从事“高精尖”科学研究。

(4)全部论文产量和顶级期刊论文产量均没得到提高的杰青科学家共11名,占全部杰青科学家人数的4.8%。造成这一比例的可能原因是:获得杰青基金本身就是一项成就,当前很多高校和研究所将获得杰青基金与薪酬、配套经费、住房及子女上学等福利挂钩[28-30]。因此,拥有杰青头衔的科学家可以获得更多福利。在没有获得杰青以前,科学家努力工作,有更多产出和更多创新性成果,从而为申请杰青基金积累条件[31, 32]。一旦拥有杰青头衔意味着名利双收、功成名就,反而妨碍科学家进一步追求更高水平的研究。

本研究还需要进一步改进:①造成4种假设的原因只是可能性推测,找出具体原因则需要基于计量经济学模型进行因果关系研究;②因分析时间要求,2010—2013年杰青科学家无法进行对比分析,未来可进作一步跟踪研究。

参考文献:

[1] BENAVENTE J M,CRESPI G,FIGAL GARONE L, et al.The impact of national research funds:a regression discontinuity approach to the Chilean Fondecyt[J].Research Policy, 2012, 41(8):1461-1475.

[2] FUYUNO D C.Cash for papers:putting a premium on publication[J].Nature, 2006, 441(792).

[3] JACOB B A, LEFGREN L.The impact of NIH postdoctoral training grants on scientific productivity[J].Research Policy, 2011, 40(6):864-874.

[4] ARORA A.The impact of NSF support for basic research in economics[J].SSRN Electronic Journal, 1996:91-117.

[5] MACCALLUM C J, PARTHASARATHY H.Open access and global participation in science[J].PLoS Biol, 2006, 4(5):176.

[6] POPP D.Using scientific publications to evaluate govemment R&D spending:the case of energy[R].Cambridge:National Bureauof Economic Research, 2015.

[7] PIERRE AZOULAY J S G Z, DANIELLE LI, BHAVEN N SAMPAT.Public R&D investments and private-sector patening:evidence from nih funding rules[J].NBER Working Paper, 2015(6).

[8] 史晓敏,彭杰,官建成.国家自然科学基金重点项目和杰出青年科学基金项目产出绩效比较[J].科技与管理,2004,6(1):128-130.

[9] 胡平,吴善超,李聪,等.我国杰出青年科技人才资助成果的评价研究[J].科学学与科学技术管理, 2009(5).

[10] 周萍,张旭,周冬梅.中国主要基金的中文论文产出绩效比较[J].科技管理研究, 2012(9).

[11] 国家自然科学基金委员会.国家杰出青年科学基金在线[EB/OL].[2016-05-19].http://www.nsfc.gov.cn/publish/portal0/tab313/.

[12] JAFFE A B G J L V.The effect of public funding on research output:the New Zealand Marsden fund[J].Working Paper,2015(3):22.

[13] AZOULAV P G Z J, WANG J.Superstar extinction[J].Quarterlv Journal of Economics,2010(25):549-589.

[14] 中国科学院文献情报中心科学计量中.JCR期刊分区数据在线平台[EB/OL].[2017-03-01].http://www.fenqubiao.com/.

[15] H M.Measuring China's research performance using the science citation index[J].Scientometrics, 2002, 53(3):281-296.

[16] Clarivate Analytics.Web of science核心合集帮助检索“授权号”字段[EB/OL].[2015-05-19].http://images.webofknowledge.com/WOKRS521R5/help/zh_CN/WOS/hs_grant_number.html.

[17] 王斌会.计量经济学模型及R语言应用[M].北京,广州:北京大学出版社,暨南大学出版社, 2015.

[18] WOOLDRIDGE J M.Introductory econometrics:a modern approach[M].Boston:Cengage Learning, 2012.

[19] WAY S,MORGAN A,CLAUSET A, et al.The misleading narrative of the canonical faculty productivity trajectory[J].National Academy of Sciences, 2017, 114(44):216-223.

[20] LARSEN P O, VON INS M.The rate of growth in scientific publication and the decline in coverage provided by science citation index[J].Scientometrics, 2010, 84(3):575-603.

[21] DEY E L,MILEM J F, BERGER J B.Changing patterns of publication productivity:accumulative advantage or institutional isomorphism[J].Sociology of Education, 1997, 70(4):308-323.

[22] GARFIELD E.Citation analysis as a tool in journal evaluation[J].Science, 1972(178):472-479.

[23] ZITT M,RAMANANA-RAHARY S, BASSECOULARD E.Correcting glasses help fair comparisons in international science landscape:country indicators as a function of ISI database delineation[J].Scientometrics, 2003, 56(2):259-282.

[24] Clarivate Analytics.In cites journal citation reports[EB/OL].[2017-06-21].https://jcr.incites.thomsonreuters.com/JCRJournalHomeAction.action.

[25] 田人合,张志强, 郑军卫.杰青基金地球科学项目资助效果及对策分析[J].情报杂志, 2016, 35(6):121-129.

[26] 田人合,张志强, 高志.基于分段线性回归模型的科学家个人科研产出规律研究——以杰青基金地球科学项目位例[J].图书情报工作, 2018, 62(1):106-116.

[27] CONG CAO R P S.China's new scientific elite:distinguished young scientists, the research environment and hopes for Chinese science[R].London:School of Oriental and African Studies, 2001.

[28] 赵雷,金盛华,孙丽,等.青年创新人才创造力发展的影响因素——基于对25位“杰青”获得者访谈的质性分析[J].中国青年政治学院学报, 2011(47):68-73.

[29] 高祀会.哈尔滨工程大学“杰青”培养模式研究[D].哈尔滨:哈尔滨工程大学, 2011.

[30] 万懿.个体成长与科研环境对杰青科研产出的影响——以国家杰出青年科学基金生命科学领域受资助者为例[D].北京:中国科学院心理学研究所, 2014.

[31] 张烨.文献计量视角下高层次人才学术成长特征研究——以管理学部杰青基金获得者为例[D].南京:东南大学, 2016.

[32] 张瑜.我国一流青年生物医学科学家科技产出研究——以国家杰出青年科学基金获得者和长江学者特聘教授为例[D].太原:山西医科大学, 2016.

The Evaluaiton Research of the Project Paper Output based on Piecewise Linear ModelEmpirical Study based on the National Science Funds of Earth Science Project for Distinguished Young Scholars

Tian Renhe1,2,Zhang Zhiqiang1,Gao Zhi3

(1.Chengdu Library and Information Center, Chinese Academy of Sciences, Chengdu 610041,China; 2.University of Chinese Academy of Sciences, Beijing 100190,China; 3.Tianjin Chengjian University, Tianjin 300384,China)

AbstractThe object of the empirical study is the the national science funds of earth science project for distinguished young scholars (Jie Qing) project between 1994-2013.The study firstly establish two evaluation index in order to measure the abilities of scientific research output and innovative scientific research output capacity.Secondly, use the "inflation-ajusted publicationsh"to eliminate the inlfation which because of the WOS increase the SCI and SSCI journal numbers.Finally, by building a piecewise linear regression model analysis the inflation-ajusted publications.The resluts show that the 68.3% of all Jie Qing scientists all publicaitons and top journal publications both improvement, 19.8% of Jie Qing scientists only raised the all publications, 7.5% of all Jie Qing scientists only raised the top journal publications, 4.4% of the jieqing scientists all publicaiotns and top publictions both did not raise.To explain the above 4 conclusions, the study analysis the existing Jie Qing scientists interview study, and explain the reason of the 4 conlusions from the aspects of scientific research environment, motivation, evaluation mechanism.

Key Words:Ability to Produce Scientific Research;Ability to Produce Innovative Research Results;National Science Foundation for Distinguished Young Scholars;Scientific Policy Evaluation

收稿日期2018-04-10

基金项目国家社会科学基金重点项目(17ATQ008);国家自然科学基金应急管理项目(41741001);天津市教育科学“十三五”规划项目(CEYP5070)

作者简介田人合(1988-),男,甘肃陇西人,中国科学院成都文献情报中心博士研究生,中国科学院大学博士研究生,研究方向为数据科学、科技政策与科学经济学;张志强(1964-),男,甘肃定西人,博士,中国科学院成都文献情报中心研究员、博士生导师,研究方向战略与规划、科技政策与管理、科技情报理论方法与应用;高志(1985-),男,山东泰安人,博士,天津城建大学图书馆馆员,研究方向为科技情报与政策。

DOI10.6049/kjjbydc.2018010290

开放科学(资源服务)标识码(OSID):

中图分类号G311

文献标识码:A

文章编号:1001-7348(2019)01-0142-10

(责任编辑:张 悦)