At present, research on the evaluation of technological security mainly involves constructing comprehensive technological security assessment or risk assessment models to evaluate the overall technological security in China. However, these approaches do not explain the internal interactions and couplings within the technological security system. Therefore, this paper introduces a coupling coordination model to assess the coupling relationships and coordination levels among the subsystems within China's S&T security system. The coupling coordination model can evaluate the balance between subsystems by measuring the interactions and development trends among multiple subsystems within the system. Although domestic and foreign scholars have applied coupling coordination evaluation models in different fields, there has been almost no application in the field of S&T security systems. Thus, this study aims to provide recommendations for promoting positive interactions within China's S&T security system, thereby enhancing the country's technological security level by using machine learning methods to evaluate the driving factors of coupling coordination in S&T security systems and the relative importance of these factors.
This study constructs an evaluation index system of the national S&T security system from four subsystems: science and technology achievement security, talent security, environment security, and activity security. It first employs the game theory combination weighting model to integrate the hierarchical analysis method and entropy weight method to get the comprehensive weights, which can avoid the single weighting method being overly subjective or objective, and thus improve the scientificity and reasonableness of the weights of the assessment indexes. Then it combines the simulated annealing algorithm with the projection pursuit evaluation method to build an evaluation model, and then a coupling coordination degree model is constructed to analyze the comprehensive development level of the national S&T security system and the coupling coordination level among the four subsystems. Finally, five machine learning algorithms, namely random forest, ExtRaTrees, gradient boosting tree, AdaBoost, and CatBoost, are deployed to further identify the driving factors of the coupling coordination degree of the S&T security system. The research results show that the development level of the national S&T security system and the coupling coordination development level of the four subsystems have increased year by year. The number of science and technology human resources per ten thousand population is the most significant driving factor for the coupling coordination level of China's S&T security system.
Corresponding countermeasures and suggestions are put forward, which can provide new ideas and methods for national S&T security management. First, the cultivation and introduction of scientific and technological talents should be stressed, and the government should establish a flexible mechanism for the introduction and mobility of talents, encourage exchanges of talents at home and abroad, and improve the overall quality and competence level of scientific and technological talents, so as to meet the needs of the national scientific and technological development. Second, the evaluation and transformation of scientific and technological achievements should be strengthened, as should the rewards and support for important scientific and technological achievements. Meanwhile, it is necessary to improve the incentive mechanism for scientific and technological innovation and create a fair and just environment for scientific and technological innovation.
党的十八大以来,以习近平同志为核心的党中央把科技创新摆在国家发展的核心位置,科学技术在总体国家安全中的战略地位和作用逐渐提高。在当今信息化时代,科技的迅猛发展给社会带来巨大变革,同时也带来新的安全挑战。科技安全系统作为总体国家安全观的重要组成部分,不仅关乎国家核心利益和长远发展,更是保障国家安全和维护社会稳定的基石[1-2]。一国科技安全应包括科技自身安全和科技支撑保障相关领域安全,涵盖科技人才、设施设备、科技活动、科技成果、成果应用安全等多个方面,是支撑国家安全的重要力量和技术基础。因此,科技安全系统主要是指由科技成果、科技人才、科技环境和科技活动等子系统组成的一个复杂系统[3]。科技安全与科技成果、科技人才、科技环境、科技活动密切相关:科技安全主要是为国家、企业、高校、科研院所开展科技创新、科技人才培养以及科技成果转化等科技活动提供保障,科技活动的开展需要整合包括科技成果、科技人才和科技环境在内的各类创新资源。科技人才既是科技活动的基本前提,也是科技成果的重要保障[4-5]。
科技安全系统耦合协同是指科技成果、科技人才、科技环境和科技活动各子系统之间相互作用的协调程度,不同子系统之间存在着复杂的耦合关系,它们相互影响、相互制约,直接影响科技安全系统整体效能。因此,研究科技安全系统内部4个子系统间是否协调,有助于推动我国科技安全系统健康发展。那么,基于科技安全系统耦合作用机理,科技安全系统内部4个子系统之间的互动关系如何?影响我国科技安全系统耦合的驱动因素有哪些?为回答这些问题,本文从科技成果安全、科技人才安全、科技环境安全和科技活动安全4个方面构建我国科技安全系统评价指标体系,运用博弈论组合赋权法、模拟退火优化投影寻踪评价模型、耦合协调度模型以及机器学习算法分析我国科技安全系统内部子系统之间耦合协调度发展水平,探索影响我国科技安全系统发展协调性的主要驱动因素,提出促进我国科技安全水平提升的对策建议,对于优化我国科技安全体系结构、提升科技安全水平具有重要意义。
从已有研究成果看,目前对科技安全系统耦合协调评价与驱动因素的研究主要集中在以下3个方面。
(1)科技安全系统评价研究。自连燕华(1998)首次提出科技安全作为国家安全的新概念以来,目前国内外关于科技安全评价的研究主要包括两个方面:一是对科技安全系统内涵[6]、概念、指标要素[7-8]以及科技安全情报体系建设的定性描述。二是科技安全系统评价和风险评估等定量研究。在科技安全系统评价方面,刁联旺等[9]搭建了包括科技实力、科技人才和科技环境3个要素的国家科技安全评价模型框架,并基于随机区间方法进行统计分析;张亚明等[10]从长短期视角对我国省域科技成果转化效率进行研究;陈红喜等[11]运用PMC指数和熵权TOPSIS模型评价长三角地区科技成果转化政策。关于科技人才评价,穆智蕊等[12]从系统观视角构建了我国科技人才评价框架体系;王成军等[13]基于可拓集理论构建创新型科技成果转化能力动态评价模型;刘云等(2023)以中国科协人才奖励为例,构建了新时代我国科技人才分类评价指标体系。在科技安全风险评估方面,张振伟等(2020)从科技安全内涵出发,构建了科技资源投入、科技成果产出及效率和科技成果支撑经济发展3个维度的科技安全风险指标体系,用以监测北京科技安全面临的风险;徐宗煌等[3]基于博弈论组合赋权法和模糊Borda法对我国科技安全风险进行评估;蔡劲松等[14-15]运用扎根理论和层次分析法构建科技安全风险评估理论框架,探讨我国关键领域科技安全内涵及面临的风险。
(2)科技安全系统耦合协调研究。当前,关于科技安全系统耦合协调的研究多聚焦于科技安全系统与其它系统间的关联互动。二元系统(科技与任一系统)研究主要包含科技与经济[16]、科技与金融[17]、科技与绿色发展[18]、科技与城市韧性[19]、科技人才与经济[20]、科技与生态[21]系统两两之间的关系,而多元系统研究主要集中于科技—经济—生态[22-23]、科技—经济—产业结构[24]、科技—经济—社会—生态[25]、科技—经济—能源—环境等系统之间的关系。总体来看,对科技安全系统内部子系统耦合关系互动的研究较少。张家年等(2016)基于结构—功能理论,通过搭建科技安全要素—结构—功能—表征模型,对科技安全协同性内涵及内容进行理论阐述,但未进行量化分析,缺乏对科技安全系统内部相互耦合作用的探讨。
(3)科技安全系统驱动因素研究。当前,国内外学者多采用层次分析法、结构方程模型和机器学习等方法进行研究。Merhi[26]运用层次分析法评价分析人工智能发展的关键因素,并对影响因素进行分类与重要性排序;孙德梅等[27]基于结构方程构建科技安全影响机理理论模型,运用Amos软件发现科技实力对我国科技安全存在直接影响,科技体制与科技政策法规对我国科技安全存在间接影响;吴丰[28]基于结构方程模型研究我国国防科技工业科技安全影响因素;任超等(2023)运用随机森林算法,通过特征重要性与相关性分析挖掘影响科学论文引用的主要因素。
综上所述,通过对现有文献进行梳理发现,当前研究存在如下不足:①从理论上看,当前研究主要通过构建科技安全综合评价或风险评估模型对我国科技安全进行评价,未揭示科技安全系统内部耦合交互逻辑与机理;②从视角上看,现有研究主要关注科技安全系统与其它系统间的关联互动,对科技安全系统内部子系统之间耦合互动关系的定量分析较少;③从方法上看,现有研究主要对科技安全协同性内涵及内容进行理论阐述,鲜有研究从实证层面阐释科技安全系统内部子系统耦合协调评价及驱动因素。因此,本文引入耦合协调度模型对我国科技安全系统内部子系统之间的耦合关系进行分析。耦合协调度模型[13]通过测量系统内多个子系统之间的相互影响关系和发展趋势评价各子系统之间的平衡性,尽管当前国内外学者已将耦合协调度评价模型应用于不同领域,但较少涉及科技安全系统。同时,运用机器学习算法评估科技安全系统耦合协调度驱动因素,对于促进我国科技安全系统内部良性互动、优化我国科技安全体系结构、提升科技安全水平具有重要意义。
科技安全是一个国家的重要保障,是支撑国家安全的重要力量和技术基础。科技安全系统是一个复杂系统,主要包括科技成果、科技人才、科技环境和科技活动4个关键子系统,它们相互交织、相互影响,共同构成科技安全系统复杂网络。这一网络中的每一个子系统都发挥着至关重要的作用,而它们之间的耦合作用则是科技安全系统稳定运行和持续发展的关键所在[3]。
(1)科技成果作为科技安全系统的核心,不仅直接反映国家科技实力和核心竞争力,而且科技成果转化和应用离不开科技人才的智力支持与科技活动的有力推动。另外,科技成果的创新性和实用性受科技环境的深刻影响,而科技环境质量又取决于科技成果积累和科技人才培育。
(2)科技人才是科技创新和发展的根本动力,他们的专业素养和创新能力直接影响科技成果质量和数量。同时,科技人才培养和成长离不开科技成果的激励和科技环境的滋养。科技活动多样性和活跃度可为科技人才提供锻炼和提升的机会。
(3)科技环境作为科技创新和发展的外部条件,其优劣程度直接关系到科技活动质量和效果。科技政策的制定和实施需要科技成果和科技人才的支撑,而科技基础设施完善则是科技活动顺利进行的保障。科技环境优化不仅有利于科技成果转化和应用,还能吸引和留住更多科技人才。
(4)科技活动是科技创新和发展的具体体现,其形式和内容丰富多样。科技活动的顺利进行不仅依赖于科技成果和科技人才的支撑,还需要科技环境的支持和保障。科技活动频繁有利于促进科技成果产出和转化,同时也有助于提升科技人才素质和数量。
可见,4个子系统之间存在紧密的耦合关系。科技成果为科技活动提供创新动力,科技活动带动科技人才成长,科技人才创造新的科技成果,良好的科技环境为上述过程提供保障;它们相互影响、相互促进,共同构成科技安全系统的核心,这种良性循环互动机制影响整个科技安全系统发展水平和竞争力。因此,对我国科技安全系统进行耦合协调评价及驱动因素研究具有重要现实意义和理论价值,不仅有助于深入理解科技安全系统运行机理,还能为制定有效的科技安全政策提供科学依据,从而确保我国科技安全稳定发展。
耦合协调理论是研究两个及两个以上系统或一个系统内部各子系统之间耦合关系协调、反馈及发展机制的理论,已应用于物理学、地理学和生态学等多个领域[29]。耦合这一概念来源于物理学,主要是指两个或两个以上系统之间的相互作用,反映系统之间的相互依赖与制约程度。协调指耦合作用关系中的良性耦合程度,表现为系统之间和谐一致、配合得当、良性循环的关系,反映协调状况。耦合与协调共同反映系统内部和谐性,展现系统内部各要素由无序转为有序的态势。系统论认为,不同系统之间存在普适性的相似性和规律性,物理学中的容量耦合系数模型作为一种通用的系统分析方法,实质上是描述系统内部各子系统之间的相互影响和协调关系,而科技安全系统内部4个子系统之间呈相互依存、相互制约、相互促进关系,这与物理系统中的耦合现象有一定相似性。因此,借鉴耦合协调度模型测算科技安全系统4个子系统之间的耦合关系及协调程度,如图1所示。
图1 科技安全系统耦合作用机理
Fig.1 Analysis of coupling mechanism in S&T security system
科技安全与科技成果、科技人才、科技环境以及科技活动存在密切联系。科技安全为国家、企业、高校、科研院所开展科技创新、科技人才培养以及科技成果转化等科技活动提供保障;科技活动开展需要整合包括科技成果、科技人才和科技环境在内的各类创新资源;科技人才既是科技活动的基本前提,也是科技成果生产和应用的重要保障[3]。
科技成果在一定程度上反映了国家科技实力,是国家实现科技发展目标和维护科技安全的基础。科技成果安全一般通过SCI论文数量占世界总量的比重、ESI论文引用率、高被引论文指数、万人发明专利拥有量、PCT专利申请量、重大科技成果数量以及国家级科技奖励数量等指标衡量[3, 9-11]。科技人才是一个国家最宝贵、最重要的战略资源,科技竞争实际上是科技人才的竞争。科技人才安全是指一国科技人才发展实力处于较高水平,在全球科技人才竞争中人才不仅不会流失,还能吸引全球人才流入,从而处于一种不受外部力量侵犯和威胁的状态。科技人才安全可运用科技人才流动、科技人才队伍结构和科技人才质量指标衡量,主要包括每万人口科技人力资源数、每百万人中从事研发的研究人员数量、每万名就业人员R&D研究人员数、R&D人员全时当量、R&D人员中硕士学位以上人员数量以及高技术产业R&D人员全时当量等指标[3,5,12-13]。科技成果数量增加、科技人才稳定和科技活动开展与高校、科研院所等科研主体所处科研环境密切相关,只有具备良好的科技环境,一个国家的科技才能持续发展,国家科技安全才能得到保障。一般而言,科技环境分为内部环境和外部环境,主要包括:①衡量国家创新能力的指标——全球创新指数;②国家科技经济投入,如国家财政科技拨款、国内R&D总支出和R&D经费支出占GDP比重等指标;③国家科技发展水平,如科技进步贡献率、全国创业风险投资机构数、国际科技合作出国项目数量以及国际科技合作来华项目数量等指标[3,9,18-19]。国家科技安全主要保障对象是科技活动,科技活动主要是指国家、企业、高校、科研院所中的科技工作者在科学技术领域组织的一系列科技知识发展和传播活动,包括:科学技术普及,如中国科协系统组织的学术交流活动次数以及举办的科普宣讲活动次数等指标;参加国外科技活动人数和接待国外专家学者人数;中国科协系统提供的决策咨询报告数量、主办科技期刊数量以及科技馆个数等[3,30-31]。
本研究通过广泛的文献调研,遵循系统性、层次性、科学性、可测性和可操作性等原则,从科技成果安全、科技人才安全、科技环境安全和科技活动安全4个子系统中选取28项指标形成我国科技安全系统评价指标体系,如表1所示。
表1 我国科技安全系统评价指标体系
Table 1 Evaluation index system of China′s S&T security system
子系统指标 指标内涵 单位科技成果SCI论文数量占世界总量的比重科技成果的影响和价值%ESI论文引用率学术论文引用情况和影响力%高被引论文指数出版物产出的影响力/万人发明专利拥有量科研产出质量和市场应用水平件PCT专利申请量知识产权整体实力件重大科技成果数量科技创新和发展实力项国家级科技奖励数量对科技创新和发展的重视程度项科技人才每万人口科技人力资源数科技人力资源总量和实力人每百万人中从事研发的研究人员数量 科技实力和国民受教育程度人每万名就业人员R&D研究人员数科技创新和研发人力资源投入水平人年/万人R&D人员全时当量国际上通用的用于比较科技人力投入的指标人年R&D人员中硕士学位以上人员数量高级研发人才学历结构和人才规模人高技术产业R&D人员全时当量高新技术产业研发投入和人才规模人科技环境全球创新指数创新能力表现/科技进步贡献率广义技术进步对经济增长的贡献份额%国家财政科技拨款为促进科技创新和发展提供的财政资金亿元国内R&D总支出研发投资、推动创新能力亿元R&D经费支出占GDP的比重科技投入强度和科技发展水平%全国创业风险投资机构数创业投资环境活跃程度和发展水平个国际科技合作出国项目数量科技的国际环境影响力与水平项国际科技合作来华项目数量科技的国际环境影响力与水平项科技活动中国科协系统组织学术交流活动次数学术交流活动活跃程度次举办科普宣讲活动次数科学技术普及活动开展情况次参加国外科技活动人数科技开放与交流国际化程度人次接待国外专家学者科技开放与交流国际化程度人次中国科协系统提供决策咨询报告数量科技服务情况篇主办科技期刊科技期刊与科技传播种科技馆个数科普基础设施建设个
目前,确定评价指标权重的方法主要有主观赋权法和客观赋权法。主观赋权法主要依靠专家经验确定评价指标权重及排序,客观赋权法则是根据原始数据之间的联系,利用数学理论方法确定指标权重,反映评价指标权重与原始数据之间的关系。考虑到国家科技安全系统的不可忽略性、待评估指标间的内在关系以及随时间变化的权重梯度,本文运用博弈论组合赋权模型,将层次分析法和熵值取权法集成得到综合权重,以提高评价指标权重赋值的科学性和合理性。具体过程如下:
3.2.1 层次分析法
层次分析法属于主观赋权法,是一种定性和定量结合、层次化、系统化的分析方法,通过将各指标分解成目标层、准则层和方案层3级,最后根据各指标优劣性进行排序,从而得到各指标的重要性权重[3]。主要步骤为:①建立层次结构模型;②构造判断(成对比较)矩阵;③层次单排序及一致性检验;④层次总排序及一致性检验。笔者通过设计专家咨询表,采用1~9标度法对评价指标体系进行打分,邀请科技安全系统领域10位权威专家进行问卷发放,每位专家在评价过程中均独立判断,以保证判断矩阵的科学性和客观性。
3.2.2 熵值取权法
熵值取权法属于客观赋权法,是通过计算各指标信息熵,根据各指标相对变化程度对系统整体的影响确定指标权重系数的一种赋权方法[32]。某个指标的信息熵越小,表明指标值变异程度越大,提供的信息量越多,权重也就越大;反之,指标信息熵越大,则权重越小。主要步骤为:①构建决策矩阵;②指标归一化处理;③计算指标的信息熵;④计算指标差异系数和权重系数。
3.2.3 博弈论组合赋权法
博弈论组合赋权法已被广泛应用于安全系统评价领域,为寻求目标系统整体利益最优解,假设各个方案均是理性决策的结果,则最终结果由所有决策者共同实现[33]。记wi(i=1,2)分别为层次分析法和熵值取权法求得的权重向量,对两组权重向量进行任意线性组合:
(1)
αi为权重向量的线性组合系数,对αi进行优化使w和wi的离差极小化,即:
(2)
根据矩阵的微分性质,导出该式的最优一阶导数为:
(3)
由式(2)求得最优权重系数(α1,α2),归一化处理后得到权重最优分配比系数通过式(3)求得最优组合权重。
(4)
投影寻踪评估法是一种处理多因素复杂问题的有效统计方法,主要是将高维数据按一定组合投射到低维空间,通过确定最佳投射值,使评估值更具有参考价值[3]。模拟退火算法作为基于Monte Carlo迭代求解策略的一种随机寻优算法,已广泛应用于解决各领域的复杂问题[34]。笔者将模拟退火算法和投影寻踪评估法相结合,建立模拟退火优化投影寻踪评估模型,主要步骤如下:①指标数据标准化处理;②构建评估对象在低维空间的线性投影;③构建投影指标函数;④利用模拟退火算法优化投影方向;⑤计算综合评估值。
(5)
(6)
式中,SZ为投影特征值的样本标准差,数值越大,说明样本数据分布越均匀;DZ为投影特征值的局部密度;局部密度窗口半径R的值取决于样本数据结构;rij为投影特征值之间的距离;I(R-rij)为单位阶跃函数。
模拟退火算法的基本原理是将高温粒子缓慢自然冷却,最终在特定温度下达到热平衡,且能达到最低能量状态。优化过程为:①按式(5)计算SZ和DZ,将其作为模型的最优初始点;②按式(4)计算目标函数值;③设置初始温度为T0 =100,迭代次数为L=100;④在SZ和DZ附近随机生成新的点,计算其目标函数值与增量Δ;⑤若增量Δ<0,则接受当前点为最优点,否则P=e(-Δ/T0),选取新的点为最优点。
耦合协调理论是对系统中各子系统或各要素之间相互作用和相互配合关系进行分析的方法[29]。耦合协调度模型用于分析事物的协调发展水平。耦合度是指两个或两个以上系统之间的相互作用程度,体现协调发展的动态关联关系,反映系统之间的相互依赖和制约程度。协调度是指耦合作用关系中的良性耦合程度,体现协调好坏。两者反映系统内部和谐性,展现系统内部各要素由无序转为有序的态势。我国科技安全系统内部4个子系统之间的耦合关系及协调程度测算公式为:
(7)
T=α1S1+α2S2+α3S3+α4S4
(8)
(9)
上式中,C为4个子系统之间的耦合度;S1、S2、S3、S4分别代表科技成果安全、科技人才安全、科技环境安全和科技活动安全指数,通过模拟退火优化投影寻踪评价模型得到:C值越大,子系统间离散程度越小,耦合度越高;反之,则子系统间耦合度越低。T为4个子系统的综合协调指数;α1、α2、α3、α4分别为4个子系统相对于科技安全系统的重要性,根据博弈论组合赋权模型得到。D为4个子系统之间的耦合度,取值范围介于[0, 1]之间。D值越高,说明耦合协调程度越高,两个系统发展越协调,反之则越不协调。借鉴已有研究,结合科技安全系统相关研究,本文将耦合协调度划分为5个阶段,如表2所示。
表2 我国科技安全系统耦合协调度不同类型划分
Table 2 Different types of division of coupling coordination degree of S&T security system in China
协调程度耦合协调度协调类型失调衰退期[0, 0.2]严重失调[0.2, 0.4]轻度失调过渡期 [0.4, 0.6]初级协调协调发展期[0.6, 0.8]中级协调[0.8, 1]良好协调
厘清影响科技安全系统内部4个子系统耦合协调的驱动因子,有助于明晰造成耦合协调度差异的主要原因,进而提出针对性建议,以促进我国科技安全水平提升。为了解不同指标对我国科技安全系统耦合协调度的影响程度,本文采用随机森林、ExtRaTrees、梯度提升树、AdaBoost和CatBoost算法[35-37]测算科技安全系统耦合协调度影响因素以及因素相对重要性程度。
3.5.1 随机森林算法
随机森林算法由美国科学家Leo提出,是一种高度灵活、以决策树为基本学习器的集成机器学习算法。在随机森林算法中,把科技安全系统各指标重要性程度定量为各变量对随机森林每棵决策树贡献度的平均值,通过比较各变量的贡献度确定变量重要程度,从而评价科技安全系统各指标对耦合协调度的影响程度。主要步骤如下:①采用基尼指数计算变量的贡献度;②基于Bagging思想和特征子空间思想进行随机森林训练;③计算特征权值并排序。
3.5.2 ExtRaTrees算法
ExtraTrees是一种基于决策树的集成方法,通过构建多个决策树对变量进行预测,以投票或平均方式确定最终分类结果。ExtraTrees Classifier是随机森林算法的一种变体,随机森林再加上一个随机化步骤,就会得到极限随机树。与普通随机森林相比,它们都是单个树的集成,但也有不同。首先,每棵树都使用整个学习样本进行训练;其次,自上而下的划分方法是随机的。它并不计算每个特征的最优划分点,而是随机选择划分点。该值是从经验范围内均匀随机选取,即在所有随机划分点中选择分数最高的值作为节点的划分点。
3.5.3 梯度提升树算法
梯度提升回归算法由两方面组成:提升(Boosting)和梯度(Gradient)。Boosting与Bagging又称为增强基础学习回归算法,它们由多个基学习器组成,其中Boosting基学习器之间表现为强依赖关系,因此串行可提升其基学习器效果,而Bagging则需并行提升基学习器效果。Boosting主要分为以下3个步骤:①训练一个初始基学习器,根据该基学习器的效果对训练集进行调整,增加当前基学习器中的弱势样本,使其在后续基学习器中训练处于强势地位;②根据调整后的训练集训练下一个基学习器;③重复以上过程直至基学习器数量达到预先设定值T,Boosting输出的值即为T个基学习器的加权和。而Gradient则是指基学习器补偿由损失函数负梯度决定。
3.5.4 AdaBoost算法
AdaBoost是一种迭代式集成学习方法,可提高弱学习器(通常指简单的决策树)性能,并解决分类问题。AdaBoost通过对训练数据重复采样和调整样本权重,使得先前弱分类器错误分类的样本在后续分类器中获得更多关注,从而逐步提高整体模型准确性。首先,使用样本训练一个弱分类器,并计算该弱分类器的错误率(误分类率)。在之后每一轮迭代中,通过增加那些被前一轮弱学习器错误分类的样本权重,减少那些被正确分类的样本权重,“迫使”新的弱学习器更关注那些“难以分类”的样本。随后,对所有弱学习器的预测结果进行加权平均或加权投票,得到最终的强学习器。
3.5.5 CatBoost算法
CatBoost是一种梯度提升树算法,在处理分类特征时更具有优势,它使用一种均值编码技术将分类特征转换为数值并在训练过程中优化特征编码。模型同时引入正则化项,包括L1正则化和L2正则化,以控制模型复杂度,进而提高模型泛化能力。与XGBoost不同,CatBoost使用一种“Ordered Boosting”策略自动调整学习率,并在训练过程中逐步减小干预。CatBoost的目标函数通常包括3部分:损失函数、正则化项和辅助函数,形式如下:
(10)
上式中,为损失函数。Ω(fk)为正则化项,用于控制树fk的复杂度,包括L1正则化和L2正则化。Γ(gj)为辅助目标函数,用于优化模型性能和鲁棒性。
基于科学性、合理性与可获取性原则,本研究选取2011—2020年为研究时段,数据主要来源于《中国科技统计年鉴》《中国统计年鉴》《中国科技论文统计报告》《中国科技人才发展报告》《我国R&D人员发展状况分析》《中国科技人力资源发展研究报告》《The State of U.S. Science and Engineering》及World Bank等。首先,对于部分年份缺失数据,采用三次线性内插和线性外推等方法予以补充。其次,对国家财政科技拨款和国内R&D总支出等与经济相关的指标作自然对数处理,避免其受价格、季节等因素的影响而产生异常波动。最后,采用极差标准化法[33]消除量纲对各指标的负面影响。
本文采用层次分析法计算科技安全4个子系统各指标的主观权重,再利用熵值取权法计算客观权重,最后采用博弈论组合赋权法将主客观权重进行集成得到综合权重,以提高指标权重赋值的科学性和合理性,结果见图2。由图2可知,在科技成果安全子系统中,指标权重排序由高到低依次为:国家级科技奖励数量(I7, 0.201 4)、高被引论文指数(I3, 0.190 0)、重大科技成果数量(I6, 0.167 8)、ESI论文引用率(I2, 0.138 1)、PCT专利申请量(I5, 0.117 5)、SCI论文数量占世界总量的比重(I1, 0.098 8)、万人发明专利拥有量(I4, 0.086 3)。在科技人才安全子系统中,指标权重排序由高到低依次为:每万人口科技人力资源数(I8,0.275 7)、高技术产业R&D人员全时当量(I13,0.169 5)、每万名就业人员R&D研究人员数(I10,0.155 9)、每百万人中从事研发的研究人员数量(I9,0.151 5)、R&D人员中硕士学位以上人员数量(I12,0.146 4)、R&D人员全时当量(I11, 0.100 9)。在科技环境安全子系统中,指标权重排序由高到低依次为:科技进步贡献率(I15, 0.253 0)、国家财政科技拨款(I16, 0.175 4)、全球创新指数(I14, 0.153 1)、R&D经费支出占GDP比重(I18, 0.099 8)、全国创业风险投资机构数(I19, 0.090 0)、国内R&D总支出(I17, 0.082 8)、国际科技合作来华项目数量(I21, 0.073 8)、国际科技合作出国项目数量(I20, 0.072 2)。在科技活动安全子系统中,指标权重排序由高到低依次为:主办科技期刊(I27, 0.213 8)、参加国外科技活动人数(I24, 0.205 8)、接待国外专家学者(I25, 0.150 6)、中国科协系统组织学术交流活动次数(I22, 0.120 1)、科技馆个数(I28, 0.118 0)、中国科协系统提供决策咨询报告数量(I26, 0.097 4)、举办科普宣讲活动次数(I23, 0.094 3)。
图2 科技安全系统评价指标权重结果
Fig.2 Results of evaluation index weights of S&T security system
为明晰我国科技安全系统随时间变化的发展情况,结合系统各评价指标,采用模拟退火优化投影寻踪评价模型测算我国2011—2020年科技安全系统综合发展水平,结果如图3所示。由图3可知,2011—2020年我国科技安全系统综合发展水平呈显著上升态势,相较于2011年的0.146,2020年我国科技安全综合发展指数高达0.835,说明近年来我国科技安全系统发展水平得到显著提高,发展势头良好。其中,科技成果、科技人才和科技环境安全水平呈逐年上升趋势,科技人才和科技安全子系统具有较强的协同性,而科技环境比科技成果、科技人才安全水平提升速度慢,科技成果安全水平由2011年的0.058升至2020年的0.285,科技人才安全水平由2011年的0.000 6升至2020年的0.320,科技环境安全水平由2011年的0.010升至2020年的0.152。究其原因,科技人才是产生科技成果的关键因素,而科技成果的产生和应用反过来可以吸引和培养更多科技人才,因此两者增长和发展趋势较为一致;科技环境包括政策环境、投资环境、市场环境等多个方面,环境改变通常需要较长时间,因此科技环境改善速度较慢。相较于另外3个子系统,科技活动安全水平大致呈“倒V”形波动变化态势,2011—2016年呈上升态势,2016—2018年呈下降态势,2020年又呈略微上升态势。这是因为,2016—2018年国际形势发生重大变化,中美贸易摩擦升级,中国在国际科技合作方面更加谨慎,导致科技活动安全程度有所下降。然而,由于科技活动往往在一定规则和制度下进行,这些规则和制度使得科技活动安全子系统具备较强独立性,即科技活动安全水平变动不会对其它系统产生影响;另外,科技活动具有较强的短期性和时效性,而科技人才、成果、环境变化受政策、经济、社会等因素的影响,相关因素变化通常是长期和渐进的,不会因为科技活动安全短期变化而产生较大影响。因此,科技活动安全变化对科技环境安全、科技人才安全和科技成果安全的影响作用较小。
图3 2011—2020年我国科技系统综合安全水平
Fig.3 Comprehensive security level of China's S&T system from 2011-2020
本研究构建我国科技安全系统中科技成果、科技人才、科技环境以及科技活动4个子系统之间的耦合协调关系,如图4所示。由图4可知,我国科技安全系统耦合度(C)、协调指数(T)以及耦合协调度(D)整体呈上升趋势。其中,耦合度(最下一条虚点线)由2011年的0.082快速升至2012年的0.274,再缓慢升至2017年的0.347,而后细微波动至2020年的0.337;协调指数(最上一条虚划线)除2016—2017年增速较小外,由2011年的0.251稳步升至2020年的2.069。从中可见,我国科技安全系统耦合度与协调指数之间存在较大差异。究其原因,耦合度仅反映科技安全4个子系统间的相互作用程度,难以评价子系统间互动的良性特征。由上述图3分析可知,当科技成果、科技人才和科技环境3个子系统安全发展水平逐年提升时,科技活动子系统反而呈现“倒V”形波动变化态势,由此导致耦合度呈现如图3外围虚点线所示的发展态势。由式(7)可知,协调指数即为图2中我国科技安全综合发展指数,其反映的是在耦合度基础上的良性程度,体现了协调程度高低。
图4 2011—2020年我国科技安全系统耦合协调发展水平
Fig.4 Development level of coupled and coordinated S&T security system in China from 2011-2020
由式(8)可知,耦合协调度综合考虑耦合度与协调指数,反映4个子系统之间的整体功效与协同效应,用以分析我国科技安全系统协调发展水平。图4中耦合协调度由2011年的0.144逐步升至2020年的0.834,我国科技安全系统在2011—2012年处于失调衰退期,2013—2015年处于过渡期,2016—2020年处于协调发展期。其中,2011年属于严重失调类型(D=0.144),2012年属于轻度失调类型(D=0.357),2013—2015年属于初级协调类型(D=0.445、0.505和0.578),2016—2019年属于中级协调类型(D=0.646、0.656、0.713和0.766),2020年属于良好协调类型(D=0.834)。可见,我国科技安全系统耦合协调发展水平逐年提升。
结合图3和图4可知,我国科技安全系统4个子系统发展水平存在一定差异,这种差异性变化直接影响耦合度、协调指数以及耦合协调度三者之间的关系。首先,科技成果、科技人才和科技环境3个子系统呈现持续增长态势,而科技活动安全水平则呈“倒V”形波动趋势,这种发展差异使得各子系统间的协同性发生动态变化,影响整体耦合度变化趋势。2011—2012年,前3个子系统同步提升可能会促进子系统间的相互协作,推动耦合度快速上升,而在2016—2018年,科技活动安全水平下降阻碍耦合度进一步提高。其次,协调指数变化反映各子系统整体发展水平。由于科技成果、人才、环境三者呈持续增长态势,因此协调指数也稳步提升,尤其是2016年以后三者同步发展使得协调指数快速增长,表明4个子系统存在良性互动,协调性得到增强。最后,耦合协调度综合反映耦合度和协调指数变化情况。2011—2012年耦合度快速上升但协调指数提升速度较慢,导致这一阶段耦合协调度处于失调衰退状态;2016年以后,尽管科技活动波动对耦合度产生影响,但由于其它3个子系统持续增长,促使协调指数快速提高,耦合协调度因此进入协调发展阶段。总体来看,各子系统发展水平差异性变化使得耦合度、协调指数和耦合协调度三者之间呈现动态变化关系,子系统间协同发展是提高系统整体耦合度的关键,各子系统整体水平提升推动协调指数上升,两者同步增长最终促进耦合协调度持续提高。因此,科技安全系统建设应注重各子系统间的均衡发展,增强系统协同性,从而实现高质量耦合协调发展。
本文采用随机森林、ExtRaTrees、梯度提升树、AdaBoost和CatBoost算法验证科技安全系统耦合协调度驱动因素以及因素的相对重要性程度。同时,采用五折交叉验证,对5种算法的均方差 (MSE)、均方根误差(RMSE)、平均绝对误差 (MAE)以及判定系数(R2) 4个评价指标进行对比。其中,判定系数R2的值越接近于1,表明算法性能越好;剩余3个指标的值越小表明算法性能越好,结果如图5所示。
图5 科技安全系统耦合协调度驱动因素分析结果
Fig.5 Driver analysis results of coupled coordination level of S&T security system
由图5(a)通过对比5种算法的4个评价指标值可知,在5种算法中,CatBoost算法的4个评价指标均好于其余4种算法,其中判定系数R2达到0.942,表明CatBoost算法性能最优,因此选择CatBoost算法对我国科技安全系统耦合协调度驱动因素进行识别。如图5(b)所示,纵坐标代表指标重要性,横坐标代表按重要性递减顺序进行排列的28个变量。从中可以看出,每万人口科技人力资源数(I8, 14.43%)是我国科技安全系统耦合协调度最主要的驱动因素,紧接其后排序前十的驱动因素分别为R&D人员中硕士学位以上人员数量(I12, 10.11%)、每百万人中从事研发的研究人员数量(I9, 9.32%)、SCI论文数量占世界总量的比重(I1, 7.16%)、重大科技成果数量(I6, 7.05%)、万人发明专利拥有量(I4, 6.36%)、ESI论文引用率(I4, 5.45%)、科技进步贡献率(I15, 4.77%)、高被引论文指数(I3, 4.77%)以及国家财政科技拨款(I16, 3.98%)。根据驱动因素结果排序,本文探讨主要驱动因素使耦合协调度在时间维度上呈现如图4所示趋势的内在原因与作用机理。
(1)每万人口科技人力资源数、R&D人员中硕士学位以上人员数量以及每百万人中从事研发的研究人员数量作为科技人才子系统的重要指标,是影响我国科技安全系统耦合协调度变化的主要因素,与图3中科技人才子系统安全水平变化趋势大致相同。科技人才是科技创新活动开展的核心力量,人才数量增加必然推动科技活动开展,为科技创新注入新动力;同时,科技人才素质不断提高反映出我国科技人力资源质量持续优化,优秀的科技人才队伍为科技成果的取得奠定了基础,也是科技活动开展的支撑。
(2)图3中科技人才安全水平在4个子系统中变化最大,从2011年的0.000 6快速提升至2020年的0.320,自2013年开始便与科技成果安全水平并驾齐驱,总体上高于科技成果子系统。图5(b)中驱动因素排序第4~第7以及第9均为科技成果子系统指标,恰好印证了图3内容。科技成果子系统指标均有大幅提高,说明我国科研质量和国际影响力持续增强,高质量科技成果为科技活动注入新活力,并为科技环境创造良好条件,从而形成正向循环,推动整个科技安全系统协调发展。
(3)驱动因素排序第8和第10为科技环境子系统指标,对我国科技安全系统耦合协调水平产生较大影响。国家财政科技拨款不断增加为科技活动提供了坚实的资金保障,推动科技人才培养、科研条件改善、重大科技项目实施,为科技成果的取得创造了有利条件;科技投入增长促进科技进步贡献率提高,有力支撑了我国科技安全系统高质量发展。
(4)科技活动子系统指标重要性排序比较靠后,表明其对科技安全系统耦合协调度影响甚微。结合图3分析结果可知,科技活动子系统对科技成果、科技人才、科技环境3个子系统的影响作用较小。在图3和图4中,2016—2017年协调指数上升出现一个平台期,科技活动安全水平却出现下降,但该阶段科技系统综合安全水平和系统耦合协调度仍保持上升趋势。可见,科技活动安全水平下降未对系统整体发展产生重大影响。
本研究通过广泛的文献调研,从科技成果安全、科技人才安全、科技环境安全和科技活动安全4个子系统中选取28项指标构建我国科技安全系统评价指标体系,通过博弈论组合赋权法、模拟退火优化投影寻踪评价模型以及耦合协调度模型分析我国科技安全系统综合发展水平及4个子系统间的耦合协调水平,进一步识别科技安全系统耦合协调度与驱动因素,得出如下结论:
(1)近年来我国科技安全系统发展水平得到显著提高,发展势头良好,科技安全综合发展指数从0.146升至0.835。科技成果、科技人才和科技环境安全水平逐年提升,科技活动安全水平呈“倒V”形波动变化;科技人才和科技成果稳定对于国家科技发展至关重要,但科技环境安全水平提升速度缓慢。
(2)我国科技安全系统耦合协调发展呈现逐年提升趋势,耦合协调度由2011年的0.144升至2020年的0.834,我国科技安全系统在2011—2012年处于失调衰退期,2013—2015年处于过渡期,2016—2020年处于协调发展期。
(3)每万人口科技人力资源数、R&D人员中硕士学位以上人员数量以及每百万人中从事研发的研究人员数量是我国科技安全系统耦合协调水平的主要驱动因素,表明科技人才是一个国家最宝贵、最重要的战略资源。一个国家科技人力资源总量及结构水平越高,科技人才实力也越强。科技成果在我国科技安全系统中发挥着举足轻重的作用。科技成果质量与数量反映一个国家在科技研究和创新方面的实力和水平,直接影响科技安全系统发展,高质量科技成果能够提升国家在全球科技舞台上的声誉和地位,促进科技交流和合作,进而增强科技安全系统耦合协调度。科技进步贡献率和国家财政科技拨款作为我国科技环境安全子系统的重要指标,是国家为促进科技创新和发展所提供的财政资金支持,能推动科技进步和经济发展,提高国家科技水平和竞争力,因此该指标对我国科技安全系统耦合协调水平具有较大影响。
根据上述研究结论,本文提出以下对策建议:
(1) 实施“人才强国”战略,构建高素质科技人才队伍。每万人口科技人力资源数是我国科技安全系统耦合协调发展最主要的驱动因素,因此应该加大科技人才培养和引进力度,建立灵活多样的人才引进和人才流动机制,鼓励海内外人才交流,提高科技人才整体素质和能力水平,满足国家科技发展需求。同时,科技人才也是一个国家最宝贵、最重要的战略资源,应加大科技人才培养力度,建设更多高水平科研机构和实验室,提供良好的科研条件和发展环境,加强科研团队建设,建立人才培养和科研项目合作机制。
(2) 加强科技成果评价与转化,提升科技创新导向性和激励性,加大对重要科技成果的奖励和支持力度。构建科技成果评价指标体系,对SCI论文数量、重大科技成果、发明专利数量、ESI论文引用率和高被引论文指数等指标进行评估和监测,及时调整科技政策和资源配置方向,提高科技成果质量和数量。同时,建立科技成果转化机制,加强科技成果知识产权保护,鼓励成果产业化应用,完善科技评价体系,精准评估科研产出质量。
(3) 完善科技创新激励机制,营造公平公正的科技创新环境。科技进步贡献率和国家财政科技拨款是我国科技环境安全子系统的重要指标,应加大科技创新和发展财政资金支持力度,推动科技进步和经济发展,提高国家科技水平和竞争力。同时,建立科技创新激励机制,完善科技成果转化和产业化体系,加强知识产权保护,为技术创新提供制度保障,激发科技工作者创新创业积极性。
本研究存在一些不足:首先,仅收集28个指标衡量我国科技安全系统发展水平,指标主要来源于文献调研,存在指标缺失和冗余等不足,未来应对指标冗余度和独立性进行优化与改进。其次,仅对中国科技安全系统耦合协调度进行评价,未考虑区域空间耦合发展水平,未来需深入探讨某个区域甚至全球科技安全系统耦合协调度空间关联水平。
[1] 周宁南, 翟一鸣, 李艳. 新安全格局下的科技安全:重要意义、现实挑战与对策思考[J]. 国家安全研究, 2023,37(4): 34-51,164.
[2] 石进, 赵小柯, 刘千里. 面向国家安全的情报支持路径[J]. 情报学报, 2020, 39(7): 675-686.
[3] 徐宗煌, 蔡鸿宇, 张伟, 等. 我国科技安全风险评估指标体系与模型构建研究[J]. 情报科学, 2023, 41(12):165-173,182.
[4] 李梦婷, 石进, 李明. 国家科技竞争情报态势感知研究[J]. 情报杂志, 2021, 40(9): 52-57.
[5] 谢文栋. 科技金融政策能否提升科技人才集聚水平——基于多期DID的经验证据[J]. 科技进步与对策, 2022, 39(20): 131-140.
[6] ZELINSKY A. Science and technology: supporting australia's national security[J]. United Service, 2014, 65(1): 14-16.
[7] 游光荣, 张斌, 张守明, 等. 国家科技安全:概念、特征、形成机理与评估框架初探[J]. 军事运筹与系统工程, 2019, 33(2): 5-10.
[8] 刁联旺, 王珩. 国家科技安全评价及其统计分析[C]//中国指挥与控制学会. 第四届中国指挥控制大会论文集. 北京:电子工业出版社, 2016: 553-557.
[9] 张亚明, 赵科, 宋雯婕, 等. 中国省域科技成果转化效率评价研究——基于长短期视角[J]. 技术经济与管理研究, 2024,45(2): 18-24.
[10] 陈红喜, 马树文, 关聪, 等. 长三角地区科技成果转化政策综合评价及提升策略研究[J]. 科技管理学报, 2023, 25(5): 22-34.
[11] 穆智蕊. 科技人才评价框架体系构建探讨[J]. 科技中国, 2023,28(1): 63-67.
[12] 王成军, 郭明. 创新型科技人才科技成果转化能力可拓评价[J]. 科技进步与对策, 2016, 33(4): 106-111.
[13] 张振伟, 黄露. 科技安全监测指标体系构建研究[J]. 科技智囊, 2020,26(4): 27-31.
[14] 蔡劲松, 马琪, 谭爽. 科技安全风险评估及监测预警系统构建研究[J]. 科技进步与对策, 2022, 39(24): 100-108.
[15] 蔡劲松, 谭爽, 武佳奇. 关键科技领域安全风险评估指标体系构建研究[J]. 中国科技论坛, 2022,37(3): 33-41.
[16] YANG J, CHENG H. Coupling coordination between university scientific &technological innovation and sustainable economic development in China[J]. Sustainability, 2023, 15(3): 2494.
[17] 崔静静, 张奇. 科技和金融耦合协调度测度、空间差异与收敛性分析[J]. 内蒙古大学学报(自然科学版), 2024, 55(1): 92-102.
[18] GAO C, CAO M, WEN Y, et al. Coupling and interaction between science and technology finance and green development: based on coupling coordination degree model and panel vector autoregression model[J]. Frontiers in Environmental Science, 2023, 11: 274.
[19] 邹蔚, 王兴宇, 万凤娇, 等. 城市韧性与科技创新水平耦合协调发展研究——以长三角城市群为例[J]. 生态经济, 2024, 40(1): 78-87.
[20] 王慧, 黄涛. 科技人才集聚与经济高质量发展的耦合协调研究——以中部六省为例[J]. 生产力研究, 2023,38(12): 25-30,161.
[21] 田立涛, 王少剑. 珠三角地区科技创新与生态环境的耦合协调发展研究[J]. 生态学报, 2022, 42(15): 6381-6394.
[22] HAN X, FU L, LV C, et al. Measurement and spatio-temporal heterogeneity analysis of the coupling coordinated development among the digital economy, technological innovation and ecological environment[J]. Ecological Indicators, 2023, 151: 110325.
[23] 黄仁全, 董娟. 陕西省经济发展、科技创新与生态环境的耦合协调发展研究[J]. 运筹与管理, 2022, 31(10): 161-168.
[24] 师应来, 赵一帆, 肖烯岚. 产业结构升级、科技创新与经济高质量发展的耦合协调研究[J]. 统计与决策, 2024, 40(1): 119-124.
[25] ZHAO J, BURKE A F. Review on supercapacitors: technologies and performance evaluation[J]. Journal of Energy Chemistry, 2021, 59: 276-291.
[26] MERHI M I. An evaluation of the critical success factors impacting artificial intelligence implementation [J]. International Journal of Information Management, 2023, 69: 102545.
[27] 孙德梅, 吴丰, 陈伟. 我国科技安全影响因素实证分析[J]. 科技进步与对策, 2017, 34(22): 107-114.
[28] 吴丰. 国防科技工业科技安全评价研究[D]. 哈尔滨:哈尔滨工程大学, 2019.
[29] YANG H, KRANTZBERG G, DONG X, et al. Environmental outcomes of climate migration and local governance: an empirical study of Ontario[J]. International Journal of Climate Change Strategies and Management, 2023, 15(3): 371-390.
[30] 王成韦, 赵炳新. 科技服务产业集聚背景下城市格局时空演变特征及趋势研究[J]. 科技进步与对策, 2019, 36(21): 62-70.
[31] 张智雄, 张梦婷, 林歆, 等. 开放科学环境下全球科技期刊的发展态势[J]. 中国科学院院刊, 2023, 38(6): 795-805.
[32] 徐宗煌, 谢晓溦, 胡卫琪, 等. 基于模糊综合评价的中小微企业信贷决策[J]. 沈阳大学学报(社会科学版), 2021, 23(3): 299-304.
[33] 胡志丁, 林瑶. 地缘位势与双边关系的互动规律探讨——以中美在东盟十国地缘博弈为例[J]. 经济地理, 2023, 43(7): 27-41.
[34] 徐宗煌, 张伟, 蔡鸿宇, 等. 我国资源安全评估指标体系与模型构建研究[J]. 干旱区资源与环境, 2024, 38(5): 1-9.
[35] 胡文静, 马建霞, 谢珍. 基于公共价值的区域知识产权高质量发展评价方法与实证研究[J]. 科技进步与对策, 2022, 39(22): 40-50.
[36] XU Z H. Machine learning-based quantitative structure-activity relationship and admet prediction models for er activity of anti-breast cancer drug candidates[J]. Wuhan University Journal of Natural Sciences, 2023, 28(3): 257-270.
[37] YAN W, YUAN Y D, YANG M H, et al. Detecting the risk of bullying victimization among adolescents: a large-scale machine learning approach [J]. Computers in Human Behavior, 2023,147: 107817.