基于科学计量的创新研究群体合作网络构型可视化分析

高 杰,丁云龙

(哈尔滨工业大学 管理学院,黑龙江 哈尔滨 150001)

摘 要:创新研究群体是受自然科学基金资助的我国基础研究前沿的高水平科研创新团队,分析并把握其结构特征与合作网络构型,有助于提升合作效率并促进原始创新。通过知识图谱可视化分析,发现并验证了优秀群体合作网络构型为晶格结构,具有较高的网络密度值,主要节点也具有较高的合作频次与中介中心性。基于科学计量的比较分析,发现了群体晶格结构具有单晶核辐射型与多(准)晶核均衡型两种形态,主要成员合作方式分别为主导型领军人物+追随型研究骨干与协调型领军人物+准晶核研究骨干,两类构型互有交织,只是在程度上有所差异。

关键词:创新研究群体;晶格结构;知识图谱;科学计量

0 引言

创新研究群体(以下简称创新群体)项目作为国家自然科学基金委(以下简称自然科学基金委)资助体系下最重要的人才类项目之一,在15年的发展历程中,推动了基础研究的整体发展和局部突破,造就了一批能够在国际上参与科学前沿竞争的科研团队,开创了从国家层面对创新团队资助与支持的新模式。创新群体项目及团队相关研究逐渐成为有关管理与评估机构、相关科研人员关注和研究的重要内容。

2015年,自然科学基金委开始将创新群体项目纳入年度绩效评估工作。2016年1月下旬,自然科学基金委针对该项目进行评估与总结发现:①项目申请团队在一定程度上存在“拼盘”现象。一些团队不是基于研究需要进行组合,而是基于项目的“光环”和“头衔”进行拼接;②主要参与者存在各自为战的情况。围绕共同目标,开展合作与交叉研究,真正解决1~2个核心或前沿科学问题,并取得具有影响力的成果是当前面临的挑战;③项目资助经费与绩效评价需充分考虑学科、学部的差异性,资助年限与形式应考虑多样性与差异性;④项目目标定位与治理结构、与其它项目的联系和区别,还需进一步明确。其中,团队结构不合理与团队主要参与者各自为战的情况,可归结为团队结构失范与合作低效,二者在一定程度上互为因果。根据基金委专家提出的策略建议,解题关键是以项目结题与绩效评价为优秀的高水平创新群体作为剖析对象,探寻团队结构的内在规律性与共性特征,从而辨析团队合作机制。

普赖斯[1-2]认为,科学合作与科学家发展呈现结晶化趋势,近年来有关团队机构类似晶格结构的研究增加。科学计量学范围较广,既包含早期应用范围较广的引文分析学、文献计量学等,也包括新近发展起来的知识图谱可视化分析、知识计量学等。知识图谱是以知识域为对象,显示科学知识发展进程与结构关系的一种图像,Citespace可视化软件是科学计量学与知识图谱可视化的代表性工具[3]

近年来,基于科学计量学与知识图谱,有关创新团队的研究逐渐增加[4],但多偏重于知识基础与学科前沿的宏观探讨或作者被引与共被引关系分析,直接研究作者合作关系以及科学计量学其它分析指标(如网络密度、中介中心性)的成果较少。目前,对于创新群体的研究多是从宏观视角分析项目资助绩效与发展情况[5-6],而从中微观视角深入挖掘团队内部合作关系与共性规律,或从顶层设计视角进行实证研究的较少。因此,本文基于科学计量的创新群体合作网络构型可视化分析,有助于弥补国内对创新群体这一特殊创新团队在合作构型研究上的不足,丰富了中微观层面科研创新团队计量学研究。

创新群体是受自然科学基金资助的高水平科研创新团队,在培养优秀人才与产出高水平成果的同时,团队合作网络密度逐渐提升,领军人物与研究骨干的引领和协调作用(可表现为合作网络主要节点的中介中心性)逐渐凸显。在部分群体产生结构失范与合作低效等问题背景下,创新群体团队结构如何合理配置,团队如何进行高效合作是创新群体发展的关键。本文基于优秀创新群体合作网络,针对结构内涵(网络构型、网络密度)与合作机制(合作发文频次、中介中心性)等内容,通过实证分析尝试解决创新群体团队合作与结构配置问题。

1 研究假设与分析框架

1.1 归核化演进与晶格结构

普赖斯[1]在对科学研究从小科学向大科学发展的论述中,认为科学合作表现出归核化与结晶化的演进趋势。有研究认为,科学研究归核化与结晶化就是有序化,而有序化就是科研群体结构合理化[7-8]。普赖斯发现,联合署名文章的增长速度越来越快,合作科研越来越多,大多数高产作者生产率提升的原因是由于一个集体领导的存在,后者使他们能完成更大的工作量[1]。好的合作者、团队以及经费平台能够支持学者产出高质量文章,高效地实现研究目标。普赖斯等研究发现,科学共同体与科研团队发展,需要仰仗精英科学家与高产作者的晶核效应,在归核化演进中促使科研团队形成合理形态并提高团队绩效[7-8]

《国家自然科学基金创新研究群体项目管理办法》提到创新群体应具备的条件,研究群体各成员应有相对集中的研究方向和共同的科学问题,在长期合作的基础上自然形成研究整体(一般10人左右),研究群体学术带头人应具有较高的学术造诣和组织协调能力,在研究群体发挥有较强的凝聚作用。研究群体中一般应有3~5位研究骨干,具有合理的专业结构和年龄结构[9]

该办法从管理角度对创新群体合理化构型提出了要求。创新群体的形成与发展是一个结晶化过程,而结晶化的重要前提是归核(Refocusing)。结晶化本身就是一个归核化过程(Refocusing Process):首先是晶核——关键人物的确定与团队构建,然后在归核化过程中组“核”成“网”,团队演进成合理形态并发展壮大。创新群体作为高水平科研创新团队,合理构型应是在学术带头人、研究骨干等 “晶核”作用下,在归核化与结晶化演进中,逐步形成的“一核”或“多核”合作网络构型,发挥领军人物的晶核效应与引领协调作用,通过团队合作实现科研突破。据此,提出以下假设:

H1:创新群体合理构型是在归核化演进中形成的合作网络构型:晶格结构,即优秀的创新群体具有科学合理的晶格结构。

1.2 网络密度

网络密度(Density)是社会网络分析与科学计量学的研究中分析团队合作网络的重要评价指标。网络密度是指网络中的实际关系数除以理论上的最大关系数,即在一个节点数量为n的无向网络中,最大可能的关系数[10],如式(1)所示。

(1)

假设实际关系数为m,那么该网络密度为2m/[n(n-1)]。采用Citespace软件绘制的科学知识图谱分为无向网络与有向网络,若为有向网络,那么节点数量为n的网络最大关系数为n(n-1),网络密度为m/[n(n-1)][10]

Wasserman与Faust[11]认为,网络密度是指网络成员间互动与合作的程度,网络密度越高,节点间的信息流越多,团队结构就越紧密与合理。Balkundi与Harrison[12]经过对37个团队的多元分析,认为具有高网络密度与强人际关系纽带的团队能够更好地实现目标与持久发展。在科研合作网络中还有其它指标可以表示网络密度,如运用网络模块值(Modularity Q)与平均轮廓值(Mean Silhouette)反映网络密度和网络聚类效果[10, 13]

Modularity Q取值区间均为[0,1],如式(2)所示。

(2)

其中,A=aij为实际网络的邻接矩阵;pij为零模型中节点i与 节点j之间连线边数的期望值;Ci和Cj分别代表节点i与节点j在网络之中所属聚类,若ij属于同一聚类,那么σ=1,否则σ=0[10]

单个样本点Silhouette值的计算公式[13]如式(3)所示。

(3)

得到-1≤Si≤1。其中,a为点i与所在类中其它点的平均距离;b为点i与最接近点i所在类中各点的平均距离,Mean Silhouette值是各样本点轮廓值的平均数[10,13]。Modularity Q与Mean Silhouette在一定取值范围内越大,网络密度值越大,网络聚类效果越好。

在科研创新团队合作网络层面,各节点代表团队成员,节点间连线代表成员合作关系。网络密度通过各节点间连线数量与结构关系反映团队合作的紧密程度。网络密度值越高,团队合作联系越多,聚类效果越好,反之亦然。创新群体作为高水平科研合作群体,团队成员的人际关系较强,交流与合作频次较多,团队协作较为充分,信息流量大,网络节点紧凑,具有较高的网络密度值。由此,提出以下假设:

H2:拥有合理构型的创新群体具有较高的网络密度值,即优秀的创新群体网络密度值较高。

1.3 中介中心性

网络中心性(Centrality)能够反映个体节点在网络中的结构特征,是社会网络分析的基本概念与重要指标。Freeman[14,15]认为,网络中心性是影响组织网络中领导力、满意度及效率的重要结构性因素,并将网络中心性分成3种类:程度中心性(Degree Centrality)、接近中心性(Closeness Centrality)及中介中心性(Betweenness Centrality)。

中介中心性作为测算相应节点中介调节效应与因子信息载荷的重要指标,越来越受研究者的重视[15-17]。在创新群体合作网络中,学术带头人(领军人物)与科研骨干作为论文合著网络中的重要作者节点,对于其它节点的中介作用、调节作用或吸附效应等,可通过中介中心性表现出来。

中介中心性(Betweenness Centrality)被定义为通过指定节点最短路径(在所有节点对之间)的数量除以任何节点对之间最短路径数量的部分(不考虑通过指定节点)[18],如式(4)所示。

(4)

节点gik表示从节点j到节点k所有最短路径条数的总和,gik(ni) 表示从节点j到节点k的最短路径中经过节点ni的路径数量,g是网络中节点数量[18]

具有高中介中心性的节点通过连接各节点与合作子群,扮演中介代理或守门人的角色,可在特定空间内频繁地控制节点网络中的信息流[19]。有研究认为,高中介中心性节点通常被认为是一个群体或组织中颇具影响力与协调力的重要指标[14, 20]。在创新群体合作网络分析中,以领军人物与研究骨干等主要作者节点的中介中心性作为计量指标。若相关节点具有高中介中心性,且节点名称确为团队成员名称,则表明该群体的领军人物或研究骨干具有较高的中介性与较强的吸附协调能力;若高中介中心性节点较多,可进一步分析其结构特征与分布规律。由此,提出以下假设:

H3:拥有合理构型的创新群体合作网络主要节点具有较高的中介中心性,即优秀创新群体网络主要节点的中介中心性较高。

基于以上3个假设的理论基础与逻辑关系,初步得出优秀创新群体具有科学合理的合作网络构型概念模型,如图1所示。

图1优秀创新群体合作网络构型概念模型

2 创新群体合作网络构型实证分析

2.1 研究方法与数据来源

2.1.1 研究方法与科学知识图谱

本文主要采用科学计量学与社会网络分析法,分析创新群体团队合作关系。类似方法常被用于科研管理领域,多从合作关系网络与论文引证网络角度,分析科研团队的网络结构、合作情况等内容[21-23],尤其是基于作者合著关系与网络中心性测量,分析团队成员合作情况的研究较多[24-26]

科学知识图谱(简称“知识图谱”)属于科学计量学(Scientometrics)范畴,是以科学知识为研究对象,显示科学知识发展进程与结构关系的一种计量图形。美国德雷克塞尔大学的学者Chen Chaomei[10, 27]应用JAVA语言开发了Citespace信息可视化软件,该软件可通过引文网络与合作网络可视化分析,探寻学科领域演化与学者合作路径,找出中介中心性高的转折节点(关键文献或重要作者),分析演进趋势并预测研究前沿。Citespace软件可将文献数据转化为知识图谱,网络节点大小可按文章频次多少显示,由节点形成的每个聚类均由研究方向相同或相近的一组科学家的合作或引用行为构成[28]。通过知识图谱可视化分析,探析优秀创新群体合作网络结构特征与合作机制,判断其合作网络构型是否为晶格结构,是否具有较高的网络密度值,主要节点是否具有较高中介中心性,进而对假设进行验证。

2.1.2 样本选择与数据来源

本文主要分析成熟、优秀的创新群体,选取样本为已结题项目群。群体项目的起始项目年限多为3年或6年,未来可能获得的一期或二期延续资助(3~6年),明确抽样范围为2011年以前结题的项目(其中基金委医学学部较特殊,选取范围为2009年立项且接近结题或已结题项目)。在2011年自然科学基金委成立25周年之际,自然科学基金委邀请国际专家评估委员会并联合国家科技评估中心,对其发展与绩效进行了国际评估。在评估中,收集了覆盖8个学部38个优秀创新群体项目的典型案例材料。研究抽样从38个优秀典型项目中,按照基金委8个学部的划分,每个学部随机抽取1个项目,共抽取8个项目。

此处抽样的创新群体均为正式团队,可通过论文合著情况直接考量合作网络关系。SCI论文是衡量科研人员实力与产出的重要指标,大多数创新群体以SCI论文为代表性成果,SCI论文在数量和质量上占据优势。根据评估专家的反馈,项目考核与同行评议的重要考量指标也为SCI论文。因此,本文以SCI论文作为数据基础,分析作者间的合作关系。

在Web of Science的核心子集数据库(Web of Science Core Collection: Citation Indexes)中,点选Science Citation Index Expanded(SCI-EXPAND)数据库(查找管理学部项目相关论文,选取其SSCI论文全面覆盖成果),以项目授权号(Grant Number)+基金资助机构(Funding Agency)方式检索项目论文。以项目授权号(批准号)为10821062的数理学部GQH创新群体项目为例,检索式应为Grant Number=10821062 AND Funding Agency=National Natural Science of China,共检索出132篇SCI论文。其它情况如管理学部CJ创新群体项目,在其结题报告与案例汇报材料中,发现还有5篇重点论文未显示项目资助信息,笔者按照论文题目和作者信息补全数据,尽可能保证数据的全面性。按照以上检索策略,检索并下载8个创新群体项目的共391篇SCI论文数据。

2.2 抽样创新群体项目团队初步可视化分析

运用Citespace软件绘制群体项目的作者合作关系网络知识图谱,每个项目分别绘制节点型(Node Type)与聚类型(Cluster Type)两种图谱,如图2、图3所示。节点型图谱能辨识各节点合作关系、合作频次、中介中心性等内容;聚类型图谱能辨识各聚类与合作子群的规模与分布等[10, 27]。进一步计算各节点的合作发文频次与中介中心性,探究合作网络内涵与规律。

在作者合作网络知识图谱中,节点大小表明节点作者合作发文频次多少,带有一系列合作关系树年轮的节点分布在一系列时间分区中,时间线从淡色到深色序列条推进显示,年轮每一圈与连线的颜色均表明在该年建立的合作关系。其中,部分高频次节点会出现深色圆环环绕,深色圆环厚度表示其中介中心性高低,开发者陈超美认为这是衡量科学发现发生转移潜在可能性的重要指标,带有深色外环的节点更容易将不同领域或不同时段的文献与合作者连接起来[10,28]。通过对知识图谱绘制与观察发现,优秀创新群体合作网络符合晶格结构特征,即在归核化演进中由“核”组“网”,形成以各种“晶核”为核心的合作子群与网络聚类,初步验证了H1

2.2.1 网络密度与网络聚类效果分析

在知识图谱可视化分析基础上,进一步计测算网络整体与网络密度的相关信息。

表1按学部抽样的8个创新群体合作网络知识图谱节点与聚类信息

a数理学部b管理学部c信息学部d医学学部e生命学部f工材学部g地球学部h化学学部GQH群体CJ群体ZHW群体ZQM群体PG群体MWM群体JZM群体JGB群体N1255011072613063108E1464913575602858117Density0.01880.040.02250.02930.03280.06440.02970.0202(Modularity)Q0.8132***0.7578***0.7924***0.774***0.7986***0.7895***0.86***0.8842***MeanSilhouette0.7741**0.7844**0.9255***0.8257**0.9219***0.9125***0.9717***0.8263**

注:(Modularity) Q>0.3*,Q>0.5**,Q>0.7***,值越大,聚类越好,网络结构越显著;Mean Silhouette>0.5*,Mean Silhouette>0.7**,Mean Silhouette>0.9***,值越大,聚类信度越高

在表1中,N表示网络节点数量,E表示连线数量,Density表示网络密度[10]。模块性(Modularity)是网络模块化评价指标,最早作为社团识别效果评价指标由Newman[10,29]于2004年提出。网络的Modularity Q值越大,表示网络聚类效果越好,社团或子群节点连线越多,Q的取值区间为[0,1],Q>0.3意味着网络结构显著,Q>0.5表示较显著,Q>0.7表示非常显著[10,29-30]。表1中8个创新群体的Q值均大于0.7,表明其合作网络结构显著性非常好。

平均轮廓值(Mean Silhouette)是另一种评价聚类效果的参数,即单个节点的轮廓系数为S=1-a/b。其中,a为点i与所在聚类中其它点的平均距离,b为点i与最接近点i所在聚类的类中各点平均距离[14,17]。Silhouette值越接近1,表明网络聚类信度越高,Silhouette>0.5表示聚类结果合理,Silhouette>0.7表示聚类信度较高,Silhouette>0.9表示聚类信度很高[10,13]。Mean Silhouette值是各样本点轮廓值的平均数,用以反映整体效果[10]。表1中8个创新群体的Mean Silhouette值均大于0.7,其中4个群体的值大于0.9,表明抽样群体的合作子群与聚类结果信度高。

通过网络密度的Density值、Modularity Q值及Mean Silhouette值3种指标测算,可知8个抽样群体的合作子群与聚类效果均显著,信度较高,验证了H2,即优秀创新群体具有较高的网络密度值与较好的聚类效果。

2.2.2 晶格结构初步分类

在创新群体合作网络节点型知识图谱(见图2)中,a-d4个创新群体的领军人物节点均较大,且被较厚的深色圆环围绕,表明其中介中心性较强,与其它节点及主要聚类多有联系;在聚类型图谱(见图3)中,a-d4个群体领军人物节点多与其它节点及聚类有较强的联系,要么与其它聚类的主要节点有直接连线衔接,要么节点本身同属多个聚类。

图2按学部抽样的8个创新群体合作网络知识图谱(节点型)

图3按学部抽样的8个创新群体合作网络知识图谱(聚类型)

图2中的e-h4个创新群体的领军人物节点大小与其它主要节点相比,差异不大,图e生命学部PG群体,领军人物节点“Gang Pei”与研究骨干节点“Jiuhong Kang”大小一样,领军人物深色圆环的厚度(中介中心性)也与部分主要节点较为接近。在聚类型图谱(见图3)中,e-h4个群体领军人物节点仅属1~2个聚类,与其它聚类联系较弱。

由此可初步判断抽样群体有两种主要合作构型,一种合作构型是领军人物带头作用明显,直接参与各合作子群及聚类的领导或合作,与研究骨干保持直接与密切的合作关系,即一个大的节点与其它主要节点均有强连接关系,表现为一核型网络;另一种是领军人物协调作用明显,参与少量合作子群与聚类的领导或合作,与其它多数聚类保持并列或独立关系,网络具有多个(准)核心节点,表现为多核型网络。

上述两种合作构型可归类为单晶核辐射型与多(准)晶核均衡型,前者为大晶核(领军人物)+多个次级晶核(研究骨干)的辐射型晶格结构,后者有多个(准)晶核且差异不大的均衡型晶格结构。根据表1中各项目的Mean Silhouette值,a-d4个属于辐射型群体项目的值基本大于0.7;e-g4个属于均衡型群体项目的值基本大于0.9,即群体聚类效果更好,因为网络具有多个核心,合作子群与网络聚类具有外部独立性与内部紧密性。

2.3 中介中心性、单晶核辐射型与多(准)均衡型晶格结构

2.3.1 中介中心性、转折点与晶格结构

如前文所述,中介中心性是一种网络中心性,是测算相应节点中介调节效应与因子信息负荷的重要指标,具有较高的影响力与协调力,能反映出其它节点的依赖性与附属性[14,18]。Chen Chaomei[10, 28]将知识图谱中具有较高中介中心性的主要节点称为转折点(Turning Point),认为该类节点更容易将不同知识领域的跨边界文献或作者节点连接起来,是知识共享与合作创新的关键枢纽,类似晶格网络的“晶核”对节点与聚类的影响。节点的中介中心性分析,对于认识创新群体合作网络结构特征与合作机制具有重要意义。

《国家自然科学基金委员会创新研究群体科学基金试行办法》提出,研究群体各成员应有相对集中的研究方向和共同的科学问题,在长期合作的基础上自然形成研究整体(10人左右)[31]。《国家自然科学基金创新研究群体项目管理办法》认为,创新群体是在长期合作基础上形成的研究队伍,包括学术带头人1人,研究骨干不多于5人[14]。由此可知,创新群体是以学术带头人为先导,由若干研究骨干(3~5人)以及其他人员组成的,具有一定网络结构与合作关系,一般以正式成员(10人左右)为主的高水平研究群体。结合“归核化”演进论述与知识图谱可视化分析,可判断优秀创新群体为“1(学术带头人)+N(研究骨干)+O(其他研究人员)”的晶格结构。运用Citespace软件与科学计量分析,可测算各网络主要节点的合作发文频次与中介中心性的数值,并按降序排列得出排名前10位的主要节点情况(如表2-9所示),进一步验证与挖掘其晶格结构内涵。

2.3.2 单晶核辐射型与多(准)晶核均衡型晶格结构验证分析

选取抽样群体中合作发文频次(Frequency)与中介中心性(Centrality)降序排名前10位的节点信息,结合知识图谱,分析与验证合作网络构型情况。

表2a数理学部GQH群体节点合作频次与网络中心性排名前10

发文频次 相关引用中介中心性 相关引用100QihuangGong(龚旗煌),20090.96QihuangGong(龚旗煌),200927HongYang(胡小永),20090.52JianjunChen(陈建军),200925QihuangGong(龚旗煌),20090.51ZhijianChen(陈志坚),201019XiaoyongHu(胡小永),20090.49LixinXiao(肖立新),201016ChengyinWu(吴成印),20090.41ChengyinWu(吴成印),200915ZhiLi(李智),20090.36JiaLi(李佳),200915YingGu(古英),20090.34ShengKong(孔胜),200914YanLi(李焱),20090.28HongYang(杨宏),200913BoQu(曲波),20100.28YingGu(古英),200913LixinXiao(肖立新),20100.21XiaopengLiu(刘晓鹏),2014

在中介中心性排名方面,a-d4个群体领军人物节点的中介中心性依然远高于其它节点,如c信息学部Z HW创新群体领军人物节点“HuaiWu Zhang”(0.4)与d医学学部ZQM创新群体领军人物节点“Qimin Zhan”(0.81)的中介中心性最高,相比其它研究骨干节点优势明显。在此类网络中,领军人物合作发文频次与中介中心性程度均为最高,且领先优势明显。其他研究骨干间程度相似,仅排名顺序略有差异,整体上对于领军人物呈现配合与追随状态。该类合作构型以主导型学术带头人与追随型研究骨干为主,符合单晶核辐射型晶格结构的推断,领军人物具有引领作用与晶核效应。

在表6-9中,由e-h4个创新群体领军人物节点的合作发文频次可知,领军人物节点合作发文频次与其它主要节点的情况相差不多,e生命学部PG创新群体领军人物节点“Gang Pei”(6)的频次数值,与排名第二位的研究骨干节点“Jiuhong Kang”(6)一样;f工材学部M WM创新群体领军人物节点“Weimin Ma”(3)的频次数值,与排名第二位的主要节点“Fei Xiao”(3)一样。

表3b管理学部CJ群体节点合作频次与网络中心性排名前10

发文频次 相关引用中介中心性 相关引用21JianChen(陈剑),20060.43JianChen(陈剑),20065GuoqingChen(陈国青),20080.2JunjieWu(吴俊伟),20085YongboXiao(肖勇波),20090.2ZeshuiXu(徐泽水),20074JunjieWu(吴俊杰),20080.19YongboXiao(肖勇波),20094ChungYeeLee,20080.15GuoqingChen(陈国青),20083ZeshuiXu(徐泽水),20070.14HuaYuan(袁华),20083HongyanLiu(刘红岩),20090.13ChungyeeLee,20083HuiXiong(熊辉),20090.13XiaolinXu(徐小林),20103JiaweiHan(韩家伟),20090.12HengyuanZhu(朱恒元),20113JuliangZhang(张菊亮),20090.1YidiGuo(郭依迪),2011

表4c信息学部ZHW群体节点合作频次与网络中心性排名前10

发文频次 相关引用中介中心性 相关引用36HuaiwuZhang(张怀武),20090.4HuaiwuZhang(张怀武),200820HuaiwuZhang(张怀武),20080.32HuaSu(苏桦),200816HuaSu(苏桦),20080.3HuaiwuZhang(张怀武),200911XiaoliTang(唐晓莉),20090.21YuanxunLi(李元勋),201110YuanxunLi(李元勋),20110.16PengLiu(刘鹏),20088PengLiu(刘鹏),20080.12YingliLiu(刘颖力),20098ZhiyongZhong(钟智勇),20090.11HaifengLu(吕海峰),20097YingliLiu(刘颖力),20090.09QiangLi(李强),20136YadongJiang(蒋亚东),20090.09GangLiu(刘刚),20086YulanJing(荆玉兰),20090.08XiaoliTang(唐晓莉),2009

在中介中心性排名方面,领军人物节点的中介中心性略低于或略高于其它主要节点,网络中主要节点分布相对均衡,如g地球学部J ZM创新群体领军人物节点“Zhimin Jian”(0.5),其中介中心性数值仅略高于排名第二位与第三位的主要节点“Wolfgang Kuhnt”(0.4)与“Meixun Zhao”(0.4);h化学学部JGB创新群体领军人物节点“Guibin Jiang”的(0.04)的中介中心性仅排名第三位,比排名前两位的节点“Thanh Wang”(0.08)与“Yawei Wang”(0.05)小,与排名靠后的主要节点差距不大。在此类网络中,领军人物合作发文频次及其中介中心性程度与其它主要节点相差不多,整体网络结构相对均衡,各合作子群与网络聚类保持内部联系。领军人物多是在自己的合作子群进行领导或合作,负责项目协调,整体网络的弱连接与结构洞较多,有助于其他研究骨干与小型团队培养,项目团队有多个(准)晶核。该类合作构型以协调型领军人物与准晶核研究骨干为主,符合多(准)晶核均衡型晶格构型的推断,领军人物具有协调作用与人才培养催化剂效用。

表5d医学学部ZQM群体节点合作频次与网络中心性排名前10

发文频次 相关引用中介中心性 相关引用9QiminZhan(詹启敏),20090.81QiminZhan(詹启敏),20095ZhihuaLiu(刘芝华),20090.57WeihuaJia(贾卫华),20114YongmeiSong(宋咏梅),20090.56ShunqianJin(金顺钱),20093ShunqianJin(金顺钱),20090.55XiaopingMiao(缪小平),20113AipingLuo(罗艾平),20090.53YangKe(柯杨),20113MingrongWang(王明荣),20090.51YixinZeng(曾益新),20113HongyanChen(陈红燕),20090.48YuanyuanShen(沈媛媛),20113FangDing(丁芳),20090.45ZhibinHu(胡志斌),20112TongTong(童彤),20090.42ZhonghuHe(何忠虎),20112YangWang(汪洋),20090.39MingrongWang(王明荣),2009

表6e生命学部PG群体节点合作频次与网络中心性排名前10

发文频次 相关引用中介中心性 相关引用6GangPei(裴刚),20080.32JiuhongKang(康九红),20086JiuhongKang(康九红),20080.17ChangLiu(刘畅),20093XiaosongLiu(刘晓松),20080.17DangshengLi(李党生),20092ChangLiu(刘畅),20090.16TaotaoChen(陈涛涛),20082GuohuiDing(丁国辉),20090.16BingLuan(栾冰),20092QiongWang(王琼),20080.14HaiyaWu(吴海亚),20092HaiboWang(王海波),20080.11WeipingJia(贾卫平),20092TaotaoChen(陈涛涛),20080.1XiaosongLiu(刘晓松),20082LanBao(鲍岚),20080.09YingWang(王莹),20082JinyanHuang(黄晋岩),20080.09XiaoyingWang(王小英),2009

表7f工材学部MWM群体节点合作频次与网络中心性排名前10

发文频次 相关引用中介中心性 相关引用3WeimingMa(马伟明),20110.16WeimingMa(马伟明),20113FeiXiao(肖飞),20120.12ZhaolongSun(孙兆龙),20112ZhaolongSun(孙兆龙),20110.11JianqingShen(沈建清),20122YuanLei(雷元),20120.11YuxingZhang(张玉兴),20112JianqingShen(沈建清),20120.09YuanLei(雷元),20122JunyongLu(鲁军勇),20110.09MingliangChen(陈明亮),20132JinXu(许金),20110.08ZhihuaZhao(赵治华),20162YuxingZhang(张玉兴),20110.07QuanfengLi(李全峰),20131BoWang(汪波),20130.04TaoTao(陶涛),20161YifeiLuo(罗益飞),20130.04QiaomingShi(石巧明),2013

表8g地球学部JZM群体节点合作频次与网络中心性排名前10

发文频次 相关引用中介中心性 相关引用3ZhiminJian(翦知湣),20090.05ZhiminJian(翦知湣),20092WolfgangKuhnt,20080.04WolfgangKuhnt,20082RujianWang(王汝建),20100.04MeixunZhao(赵美训),20092HuiWang(王辉),20080.03LiLi(李莉),20082ZhifeiLiu(刘志飞),20080.03PinXianWang(汪品先),20092FernandoPSirin-gan,20080.02ZhifeiLiu(刘志飞),20082YulongZhao(赵玉龙),20080.02YulongZhao(赵玉龙),20082LiLi(李莉),20080.02XiaohuiDing(丁晓辉),20102MeixunZhao(赵美训),20090.02PinxianWang(汪品先),20082JunTian(田军),20080.01FernandoPSirin-gan,2008

通过对中介中心性等内容的比较分析,验证了H3,即优秀创新群体的主要节点均具有较高的中介中心性。继绘制知识图谱后进一步验证了H1,即优秀创新群体合作网络为晶格结构,也验证了创新群体合作网络结构的两种类型:单晶核辐射型与多(准)晶核均衡型,前者领军人物引领作用显著,后者领军人物协调作用显著。

3 结论与启示

3.1 研究结论

本研究从创新群体结构失范与合作失效问题出发,挖掘优秀创新群体合作网络结构内涵与合作机制,特别是对团队结构合理构建以及团队合作机制有效运行等方面的内容,进行了理论与实证探究。通过对晶格结构、网络密度、中介中心性等假设的验证与分析,得出以下结论:

(1)通过绘制知识图谱与科学计量分析,发现创新群体合作网络为晶格结构,各节点在主要节点的“晶核效应”下,在“归核化”演进中由“核”组“网”成型,形成“一核”或“多核”的合作子群与网络聚类。晶格结构主要分为单晶核辐射型与多(准)晶核均衡型两种,领军人物有主导型与协调型两种,研究骨干有追随型与准晶核两种。

(2)通过对抽样群体网络密度值(Density、Modularity Q与Mean Silhouette值)的测算,可知群体网络具有较高的网络密度值与较好的网络聚类效果。通过对主要节点合作发文频次(Frequency)与中介中心性(Betweenness Centrality)的测算,发现其主要节点具有较高的中介中心性,并进一步验证了晶格结构的两种形态。

表9h化学学部JGB群体节点合作频次与网络中心性排名前10

发文频次 相关引用中介中心性 相关引用21GuibinJiang(江桂斌),20080.08ThanhWang,200813MinghuiZheng(郑明辉),20080.05YaweiWang(王亚伟),200912ShuzhenZhang(张淑珍),20080.04GuibinJiang(江桂斌),200810HailinWang(王海林),20080.04JingfuLiu(刘景福),20089LianghongGuo(郭良宏),20080.03JianjieFu(付建杰),20149ThanhWang,20080.03WeijinYang(杨伟金),20149PeterChristie,20080.02YongguangYin(阴永光),20098JinmingLin(林金明),20080.02GuibinJiang(江桂斌),20088KeXiao(肖珂),20090.02JingfuLiu(刘景福),20097GangPan(潘刚),20090.02YaqiCai(蔡亚岐),2009

图4优秀创新群体晶格结构

(3)通过社会网络分析与科学计量学方法,验证了优秀创新群体合作网络为晶格结构,具有较高的网络密度值与较好的聚类效果,主要节点具有较高的中介中心性。晶格结构分为单晶核辐射型与多(准)晶核均衡型,领军人物有主导型与协调型,以及追随型研究骨干与准晶核研究骨干的存在。两种形态互有交织,只是程度有差异。

3.2 思考与启示

创新群体有关研究多是经验总结与绩效分析,鲜有基于科学计量学与知识图谱分析的实证研究,本文在某种程度上丰富了相关理论研究。宏观层面,创新群体在归核化演进中形成的合作网络为晶格结构;中观层面,晶格构型分为单晶核辐射型与多(准)晶核均衡型,网络密度值较高;微观层面,各主要节点具有良好的引领作用或协调作用,通过合作发文频次与中介中心性的比较分析,可知主导型领军人物+追随型研究骨干的组合是单晶核辐射型群体的主要合作方式,协调型领军人物+准晶核研究骨干的组合是多(准)晶核均衡型群体的主要合作方式。

在实践层面,未来通过对创新群体合作机制和合作绩效的考量与评估、合作网络可视化分析,以及主要节点的相关信息进行科学计量,可评析群体项目合作网络构型以及团队成员参与情况,并结合同行评议与专家意见,丰富创新群体绩效评价方法。

创新群体是国家自然科学基金委资助的基础研究团队,既是具有中国特色的科研创新团队,也是介于小规模创新团队(突出个人)与大型创新团队(以大科学工程等为代表)之间的中等规模创新团队。分析与掌握其结构特征与内在规律,可在理论建设与实践评价方面进行拓展研究。限于时间、篇幅与研究条件,未能对代表性创新研究群体开展深入调研与案例研究,从内部合作因素与结构化访谈入手,探索创新群体合作机制,将是未来研究的重点。

参考文献:

[1] D·普赖斯.大科学小科学[M].宋剑耕, 戴振飞,译.北京:世界科学出版社,1982.

[2] CONTRACTOR N.Some assembly required:leveraging web science to understand and enable team assembly[J].Physical and Engineering Sciences, 2013, 371(1987):1-14.

[3] 陈悦, 陈超美, 刘则渊,等.CiteSpace知识图谱的方法论功能[J].科学学研究, 2015, 33(2): 242-253.

[4] 张惠琴,侯艳君.基于知识图谱的国内员工创新行为研究综述[J].科技进步与对策, 2017, 34(10): 1-8.

[5] 张垒.国家创新研究群体建设研究——基于国家自然科学基金项目的计量分析[J].情报杂志, 2012, 31(7): 97-102.

[6] 余谦, 马俊杰, 刘雅琴.基于创新群体培育评价的创新研究群体基金资助成效分析[J].中国科学基金, 2015(2): 99-107.

[7] NEWMAN M E J.The structure of scientific collaboration networks[J]. the National Academy of Sciences, 2001, 98(2): 404-409.

[8] WAGNER C S, LEYDESDORFF L.Network structure, self-organization, and the growth of international collaboration in science[J].Research policy, 2005, 34(10): 1608-1618.

[9] 国家自然科学基金委.国家自然科学基金创新研究群体项目管理办法[Z].北京:国家自然科学基金委, 2014.

[10] 李杰, 陈超美.Citespace: 科技文本挖掘及可视化[M].北京:首都经济贸易大学出版社, 2016.

[11] WASSERMAN S, FAUST K.Social network analysis: methods and applications[M].Cambridge:Cambridge university press, 1994.

[12] BALKUNDI P, HARRISON D A.Ties, leaders, and time in teams: strong inference about network structure's effects on team viability and performance[J].Academy of Management Journal, 2006, 49(1): 49-68.

[13] ROUSSEEUW P J.Silhouettes: a graphical aid to the interpretation and validation of cluster analysis[J].Journal of computational and applied mathematics, 1987(20):53-65.

[14] ABBASI A, HOSSAIN L, LEYDESDORFF L.Betweenness centrality as a driver of preferential attachment in the evolution of research collaboration networks[J].Journal of Informetrics, 2012, 6(3): 403-412.

[15] FREEMAN L C.Centrality in social networks: conceptual clarification[J].Social Networks, 1979, 1(3):215-239.

[16] FREEMAN L C.A set of measures of centrality based on betweenness[J].Sociometry, 1977, 40(1):35-41.

[17] NEWMAN M E J.A measure of betweenness centrality based on random walks[J].Social Networks, 2005, 27(1):39-54.

[18] GUNS R, LIU Y X, MAHBUBA D.Q-measures and betweenness centrality in a collaboration network: a case study of the field of informetrics[J].Scientometrics, 2011, 87(1):133-147.

[19] GUAN J, ZHANG J, YAN Y.The impact of multilevel networks on innovation[J].Research Policy, 2015, 44(3): 545-559.

[20] BURT R S.Structural holes: the social structure of competition[M].Boston:Harvard University Press,2009.

[21] SUBRAMANYAM K.Bibliometric studies of research collaboration: a review[J].Journal of Information Science, 1983, 6(1): 33-38.

[22] NEWMAN M E J.The structure of scientific collaboration networks[J].the National Academy of Sciences, 2001, 98(2): 404-409.

[23] DING Y.Scientific collaboration and endorsement: network analysis of coauthorship and citation networks.[J].Journal of Informetrics, 2011, 5(1):187-203.

[24] WAGNER C S, LEYDESDORFF L.Network structure, self-organization, and the growth of international collaboration in science[J].Research Policy,2005,34(10):1608-1618.

[25] GLNZEL W, SCHUBERT A.Analysing scientific networks through co-authorship[M].Berlin: Springer Netherlands, 2004.

[26] GUNS R, LIU Y X, MAHBUBA D.Q-measures and betweenness centrality in a collaboration network: a case study of the field of informetrics[J].Scientometrics, 2011, 87(1):133-147.

[27] CHEN C.Citespace II: detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the American Society for Information Science and Technology, 2006, 57(3): 359-377.

[28] 陈超美.科学前沿图谱:知识可视化探索[M].北京:科学出版社, 2014.

[29] NEWMAN M E, GIRVAN M.Finding and evaluating community structure in networks[J].Physical Review E Statistical Nonlinear & Soft Matter Physics,2004,69(2):113.

[30] HU Y, WU J, DI Z.Enhance the efficiency of heuristic algorithms for maximizing the modularity Q[J].Europhysics Letters, 2009, 85(1):180.

[31] 国家自然科学基金委.国家自然科学基金委员会创新研究群体科学基金试行办法[Z].北京:国家自然科学基金委, 2001.

VisualizationAnalysisofCooperationNetworkConfigurationofCreativeResearchGroupbasedonScientometrics

Gao Jie, Ding Yunlong

(School of Management, Harbin Institute of Technology, Harbin 150001, China)

Abstract:The creative research group is the high-level scientific research innovation team supported by the Natural Science Foundation of China.Analyzing and grasping the structural features and cooperative network configuration of creative research groups, could improve the efficiency of cooperation and promote the original innovation.Through the visualization analysis of knowledge maps of cooperation networks of excellent creative research groups, we find and verify excellent groups have lattice structure with high network density value, while the main nodes have high cooperation frequency and betweenness centrality.Based on the comparative analysis of scientometrics, the excellent group lattice structure has been summarized as two forms: "single-nuclear radiation type" and "multi-quasi-nucleus equilibrium type".There are two cooperation modes of main members: "leading-type leader + follow-type research cadres" and "coordinated leadership + quasi-crystal research cadres".Two types of configurations are intertwined, but the degrees differ.

Key Words:Creative Research Group; Lattice Structure; Knowledge Map; Scientometrics

收稿日期:2017-06-08

基金项目:国家自然科学基金项目(L1524035)

作者简介:高杰(1986-),男,河北石家庄人,哈尔滨工业大学管理学院博士研究生,研究方向为科技政策与科研管理;丁云龙(1963-),男,吉林扶余人,博士,哈尔滨工业大学管理学院教授、博士生导师,研究方向为科技政策与科研管理。

DOI:10.6049/kjjbydc.2017030783

中图分类号:G316

文献标识码:A

文章编号:1001-7348(2018)07-0009-08

(责任编辑:张 悦)