Following the essential characteristic theory of disruptive technology, this study makes disruptive technology measurement that integrates multi-source data, including growth rate indicators, innovation indicators and influence indicators, and comprehensively considers the impact of technology on the scientific community, technology community, and social economy community. Among them, the growth of technology is measured by the growth rate index to calculate the difference between the growth of each topic in the current year and the previous year; the CIM model is used in the innovation index to judge the inheritance and breakthrough of the previous research in the paper or patent; social impact indicators are used to analyze and count the frequency of searches and other relevant statistics for a certain keyword displayed in Google during a certain period of time.
In order to effectively identify disruptive technologies in the field of "dual carbon", this paper collects 38 692 paper data and 9 532 patent data, and retrieves the search frequency data of public topic representative words from Google Trends to form a multi-source fusion dataset. In the process of method selection, this paper selects the improved CDTM(Common and Distinctive Topic Model) model for topic extraction from multiple data sources. This method maximizes the utilization of shared information among multiple corpora, allowing for not only the extraction of specific topics for a single data source, but also the integration of paper and patent data to obtain a common theme for multi-source data. By analyzing the results of CDTM model and manually judging them one by one, 10 topics are finally obtained for identifying disruptive technologies in the field of "dual carbon", and then the disruption index score is calculated to measure the disruption of these topics.
Four disruptive technologies in the field of "dual carbon" are identified,namely biochar adsorption technology, organic biochar-based fertilizer preparation technology, biomass cracking biochar technology and biomass pyrolysis biochar technology. The analysis shows that all four technologies are related to internationally recognized “carbon capture, use and storage (CCUS) technologies”, and China and the United States occupy overwhelmingly dominant positions in the field of "dual carbon" research. Hence, China should provide preferential resources, continue to deepen technological innovation, and improve intellectual property protection.
In regards to the technology bottlenecks, it is necessary to open the catch-up strategy for the world's core technology, increase the R&D investment in basic disciplines, and achieve technical overtaking on the bend to improve the core competitiveness. In view of the four disruptive technologies identified in the field of "dual carbon", it is suggested that the relevant departments of the government and enterprises focus on research and development, rationally allocate valuable and limited resources, and improve the efficiency of research and development. In terms of macro-government regulation, it is essential to improve the market diversification investment mechanism, encourage social capital to enter the field of disruptive technologies in a market-oriented way, and set up funds to provide financial support for them. In summary, the measurement and identification of disruptive technologies in the field of "dual carbon" based on the multi-source data fusion method helps to comprehensively understand the frontier of scientific and technological innovation in the field of "dual carbon", and provides a new basis for the identification and research of disruptive technologies.
《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》明确提出强化颠覆性技术供给,以颠覆性技术创新为重点,培育颠覆性创新文化,开拓颠覆性技术领域。2022年8月科技部等九部门联合印发《科技支撑碳达峰碳中和实施方案(2022—2030年)》,提出要聚焦基础研究最新突破,加快培育颠覆性技术创新成果,引领实现产业和经济发展方式迭代升级。
碳达峰碳中和是我国着力解决资源环境约束突出问题、实现中华民族永续发展的重大战略决策,党的二十大报告强调“积极稳妥推进碳达峰碳中和”,专节对“双碳”工作作出系统安排。实现碳达峰碳中和是一场广泛而深刻的经济社会系统性变革,我国“双碳”目标的实施要以“双碳”工作为总牵引,抓住新一轮科技革命和产业变革机遇,强化绿色低碳科技创新,密切追踪国际前沿领先技术。为此,“双碳”领域的颠覆性技术度量和识别成为洞察全球“双碳”技术机会与抢占科技竞争制高点的关键。
现有研究对颠覆性技术的评价和度量仅考虑该技术对科学技术界的影响,而忽视了社会公众对前沿技术的关注。有研究表明,技术发展除技术改进的自身动力外,其本身也是一项社会行动,体现国家战略与社会需求[1]。网络社交媒体对某个主题领域动态持续性的关注,往往体现社会与公众利益和需求所在;主题领域的科学研究受到公众关注度越高,意味着该研究具有越大的社会影响力。因此,为尽可能全面地评价和识别潜在颠覆性技术,本文结合论文数据、专利数据以及社会媒体数据,构建多源数据融合的颠覆性技术测度体系,度量和识别“双碳”领域颠覆性技术,为政府相关部门和企业未来产业发展战略部署、宏观政策的科学精准制定、技术弯道超车实现、核心竞争力提升等提供参考。
颠覆性技术最早由美国哈佛大学商学院Christensen教授提出,其主要观点是颠覆性技术从边缘或者低端市场发展起来,随着时间的推移,逐渐取代原有主流技术[2]。经济学家Schumpeter[3]提出的创造性破坏理论认为,发展的本质在于将创新引入生产体系,每次大规模的创新都会淘汰旧的技术体系和生产体系,以建立新的生产体系;王康等[4]将颠覆性技术视为改变游戏规则和重塑未来格局的革命性力量,构建影响力、相似性和新颖性指标,识别颠覆性的技术融合;Dahlin等[5]认为一个有效的技术颠覆以及一项突破的发明应该是新颖的、独特的、对未来技术有影响的;Thomond等[6]认为颠覆性创新是具有高度不连续性或革命性质的创新,将颠覆性技术特征概括为新颖性、新兴性、可发展性、颠覆性、延展性;Kenagyz等[7]将颠覆性技术特征概括为简易性、易忽略性、可发展性、易使用性、智能性;许佳琪等[8]基于现有文献区分突破性创新和颠覆性创新,认为突破性创新属于技术创新层面的概念,而颠覆性创新注重技术和组织资源的融合,涵盖了所有创新范畴;李昱璇等(2024)基于“卡脖子”技术与颠覆性技术辨析,指出颠覆性技术采用差异化策略和非对称路径,将已有主流技术成果归零,实现技术本身的替代和弯道超车;王康等(2022)基于颠覆性技术的概念辨析,指出在技术突破领域,颠覆性技术是指具有颠覆传统技术路线和改变游戏规则等革命性意义的技术创新,是对原有技术体系和应用系统产生颠覆性进步作用的重大技术,与新兴技术和前沿技术的最大区别在于颠覆性技术具有突破性创新特征。
除Christensen教授提出的颠覆性技术理念外,截至目前,还没有一个明确的颠覆性技术概念界定。为了解颠覆性技术的本质特征,本文对现有研究中用于识别颠覆性技术的特征作进一步梳理归类(见表1),归纳出颠覆性技术具有增长性、创新性、影响力、突然性、新颖性和不连续性等特征[9-13]。
表1 现有研究中的颠覆性技术识别特征
Table 1 Identification characteristics of disruptive technology in existing research
序号作者(发表年份)特征1Thomond等(2002)新颖性、新兴性、可发展性、颠覆性、延展性2Kenagyz(2002)简易性、易忽略性、可发展性、易使用性、智能性3Dahlin等(2005)新颖性、独特性、影响力4Arthur(2007)不连续性、突然性、创新性5Valle等(2009)创新性、相似性6Manyika等(2013)增长性、影响力7孙永福等(2017)突破性、替代性、影响力8Reinhardt等(2018)嵌入性、创新性9开庆等(2021)替代性、突变性、破坏性10纪亚琨(2022)宏观融合性、新颖性、影响力11王康等(2022)影响力、相似性、新颖性
随着颠覆性技术越来越受到重视,颠覆性技术的识别方法也在不断发展,大致可以分为几个阶段。早期阶段技术识别手段不足,学者对颠覆性技术的识别仅使用定性方法,包括德尔菲法、问卷调查法、情景分析法、技术路线图等[14-15]。如何发现该领域的技术前沿、技术热点、技术机会,以及识别和预测颠覆性技术等都需要依靠专家意见来确定,后续收集高质量调查问卷也需要大量人力和物力,对研究进展和深度都会产生一定局限性。由于定性方法识别颠覆性技术不尽完美,研究人员开始采用定量方法度量颠覆性技术[16-17]。Tugrul等[18]将文献计量学、专利分析、情景规划、增长曲线和类比等技术预测工具相结合,对相关领域开展颠覆性技术识别和预测;Dotsika等[19]提出一种基于文献驱动的潜在颠覆性技术趋势预测方法,采用关键字网络分析和可视化方法揭示出版物中的突发主题、结构和时间发展,为颠覆性领域技术的事前预测作出了重要贡献。随着大数据人工智能时代的到来,机器学习技术不断发展,颠覆性技术的识别方法又迈上了新台阶,学者们不再局限于采用文献计量学方式识别颠覆性技术,开始转向基于机器学习的方法进行测度和衡量,例如Xu Shuo等[20]采用多机器学习的方法识别新兴研究主题,利用多任务最小二乘支持向量机(MTLS-SVM)对未来两年的结果指标进行预测;Xu Xueming[21]利用LDA模型进行主题聚类,考虑时间的影响,利用增长率、原创性、专利影响因子、颠覆性指数等多指标进行分析,筛选出有价值的颠覆性技术。主题识别模型方法也进一步完善,不断从LDA模型等传统模型中扩展演变,其中CDTM模型考虑到不同语料库的共性和特性,融合识别多源数据的公共主题和特有主题[22]。在选择数据源时,研究人员利用专利引文分析、专利特征或科学论文数据的文献计量指标作为识别颠覆性技术的有力工具[23-25],逐渐呈现出从单一数据到多源数据的发展,例如刘忠宝等[26]利用文献和专利数据的摘要主题识别颠覆性技术。
以往研究对指标的选取大多只考虑技术视角或经济视角[3-4],目前还没有一种很好的方法将两个视角结合起来,且选取的指标大多集中在衡量其科学性和技术性两个方面,影响力指标的测度也只聚焦于文献和专利的科学影响,缺少对社会影响的度量。在数据源选择上,大多数研究仅选择文献数据或专利数据等单一数据源[26],不能融合包括社会媒体数据在内的多源数据对颠覆性技术进行更全面的度量。为此,本文采用改进的CDTM主题抽取模型,研究多源数据融合的颠覆性技术度量及识别,将技术对社会公众和经济层面的影响与科学技术层面的影响相结合,从多个角度度量某项技术是否具有颠覆性。
本文基于颠覆性技术的本质特征理论,借助Wang[27]和Xu Shuo等[20]的思想,将多源数据融合的颠覆性技术测度归纳为增长率指标、创新性指标、影响力指标和连贯性指标。另外,增长性和突然性归并到增长率指标,创新性和新颖性归并到创新性指标。有研究指出,连贯性指标反映主题词的语义在不同年份的一致性问题[20],但在后续的实证研究中发现不同主题的连贯性基本上是一致的,说明该指标没有区分度,故本文对颠覆性技术的测度不再考虑连贯性指标。
技术增长率指标主要从时间层面上考虑一项技术的出现和发展情况,获得一项技术的发展轨迹,观察其“突然”性的出现。增长率指标反映不同年份各个主题的增长差异,旨在识别出特定时间段内增长较快的主题,该指标通过计算每一主题当年与上一年的增长差异来衡量技术增长情况。增长率指标也是区分颠覆性技术与主流技术及新兴技术的重要指标,重点测度技术在某一时间段的“突然”性出现,并不强调是近期的“突破”性出现,也不要求技术的生命周期一直发展至成熟期。本文将增长率指标记为Growthk,即第k个研究主题的增长率。如果计算出的增长率数值在某个时间段有明显上升趋势,则说明这个主题具有颠覆性。
创新性是技术的核心属性,是衡量颠覆性技术的重要指标,强调颠覆性技术突破和改进领域中原有主流技术的特征,故创新性较强的技术被认为具有一定颠覆性。通过论文数据和专利数据衡量一项技术的创新性,需要判断该论文数据和专利数据与其所引用的论文或专利是继承还是创新的关系,若为颠覆性技术,则必然与其所引用的论文或专利主题内容不同,故可以使用前向比较方法判断技术创新性,即如果某项技术与之前的技术不同,具有突破性或者破坏性,则认为该项技术具有颠覆性。本文通过论文或专利与其发表前的学术研究作对比,使用CIM模型(Citation Influence Model)从施引文献和被引文献反映的主题中判断主题间的继承或突破关系[28],进而计算该主题的创新性指标Noveltyk。
衡量一项技术的颠覆性需要考虑其对学界和社会的影响力。如果一项技术具有颠覆性,则该项技术不仅会在科学技术层面产生增长率和创新性等方面的影响,也会在社会媒体中引起一定的“轰动”。颠覆性技术影响力测度指标往往使用文献或专利的被引频次衡量,但对出现较新的颠覆性技术来说,被引频次存在严重的滞后性且存在被引次数积累较少的问题。相较而言,网络社交媒体可以动态持续关注某个主题领域,体现出技术影响社会的实时性,其中,Google Trends数据作为一种社会媒体数据,具有被引频次数据所不具备的时效性和敏感性,有助于对颠覆性技术更精确地识别和捕捉。为此,本文使用社会媒体数据替代被引频次数据,表征颠覆性技术测度的社会影响力指标Impactk,通过Google Trends指标分析和统计某一关键词某一时期在谷歌搜索引擎中搜索的频率及其相关统计数据。
对“双碳”领域颠覆性技术的识别主要分为以下几个步骤,如图1所示。
图1 技术路线图
Fig.1 Technology roadmap
本文的文本数据来自Web of Science的核心数据库中的学术论文,以及来自Derwent Innovation Index数据库的专利数据,选取的时间节点是2005—2021年共17年。检索式的构建尽可能全面参考各部门发布的权威资料,如《科技支撑碳达峰碳中和实施方案(2022—2030年)》、《碳达峰、碳中和精炼报告:政策、趋势、技术、案例、观点及研究方法》,以及《北大金融评论》发布的“双碳”目标下的技术路线图等,检索式TS=("carbon* captur* tech*" OR "carbon* utilization* tech*" OR "carbon* storag* tech*" OR "carbon* fixation* tech*" OR "photovoltaic* tech*" OR "nuclear* reactor* tech*" OR "clean* energ* tech*" OR "hydrogen* energy* tech*" OR "low* carbon* tech*" OR "enviro* tech*" OR "green* tech*" OR "zero* carbon* tech*" OR "carbon* emission* reduction* tech*" OR "sustain* energy* tech*" OR "carbon* neutrali* tech*" OR "carbon* offset* tech*" OR “efficient electric heating conversion tech*” OR “heat storage tech*” OR “intelligent control tech*” OR “efficient electric tech*” OR “advanced power transmission tech*” OR “carbon sink” OR “biochar” OR “enhanced weathering” OR “ocean alkalization” OR “ocean fertilization” OR “carbon* removal* tech*” OR “solar radiation management tech*”),用于收集学术论文和专利数据信息。
本文收集2005—2021年论文和专利数据,通过过滤标题、摘要、关键词和作者信息,最终得到48 224篇,其中论文数据38 692篇、专利数据9 532篇。论文数据包括标题、摘要、作者、出版日期、参考文献等,专利数据涉及标题、摘要、专利家族、IPC等。将数据存放入MySQL数据库以便后续处理,并对收集到的数据作预处理,包括大小写转化、去停用词和标点符号、分词、词性标记和词形还原等。论文和专利数量的年度分布如图2所示,2005—2021年“双碳”领域的研究论文一直呈现出快速增长态势,可见这一领域得到了全球学者的高度关注;相关专利在2020年之前也呈现出逐年递增态势,之后可能受全球新冠疫情的影响而有所下降。
图2 论文、专利数量年度分布情况
Fig 2 Annual distribution of papers and patents
Google Trends数据可通过https://trends.google.com网站统计分析Google搜索引擎每天数十亿的搜索数据,获取某一关键词或者话题在特定时间段的搜索频率及其它相关统计数据。Google Trends数据的时间锁定在2005—2021年,根据主题模型得到每一公共主题中前20位主题代表词,将其在网站中检索,获取每一主题代表词的搜索频次数据。
本文研究数据采用多源数据融合的形式。LDA模型(Latent Dirichlet Allocation)[29]、DIM模型(Dynamic Influence Model)[30]和DTM模型(Dynamic Topic Model)[31]等传统模型可以提取单个数据源的主题,无法兼顾多个数据源公共主题的提取。CDTM模型(Common and Distinctive Topic Model)是一个层次贝叶斯模型,能最大限度地利用多个语料库之间的共享信息[32],不仅可以针对单数据源提取出特有主题,还可以融合论文和专利数据获取多源数据的公共主题。改进后的CDTM模型在上述优势的基础上,还克服了原始CDTM模型将每个语料库特有主题的数量设置为相同的缺陷。因此,本文使用改进后的CDTM模型抽取来自学术论文和专利数据的公共主题,用于“双碳”领域颠覆性技术的识别。图3为改进后的CDTM模型的概念图,通过加入不同的超参数,放宽原本每个数据集特有主题数一致的限制。该模型的后验过程使用折叠Gibbs抽样算法,它是马尔科夫链蒙特卡洛方法(Markov Chain Monte Carlo)的一种特例,本文将对称狄利克雷/贝塔分布先验α0、αζ、β0、β1和γ分别设置为0.1、0.1、0.001、0.001和0.5,Gibbs采样运行1 000次,其中200次为老化期。
图3 改进后的CDTM模型
Fig.3 Modified common and distinctive topic model
论文与专利的最佳主题数通过计算数据的困惑度确定[33],因论文数据的数量约是专利数据的4倍,为使计算更简洁方便,只计算专利数据的困惑度即可。运用Python构建困惑度求解模型,求解最优主题数,困惑度越小主题数越优,因此计算出的专利数据困惑度最小值对应的主题数为30。根据困惑度计算结果得到专利数据和论文数据的最佳主题数分别为30个和120个,即模型中各个数据源的特有主题参数。CDTM模型中公共主题参数的确定,根据《北大金融评论》发布的“双碳”目标下的技术路线图,可以分为煤炭领域、石油领域、天然气领域、光伏领域、风能领域、核能领域、水电领域、氢能领域、交通领域、建筑领域、制造业领域、农业领域、碳捕集技术领域、碳利用技术领域和碳封存技术领域等15个公共主题。
通过CDTM模型的结果,可总结得到每个公共主题下前20位代表词,如表2所示。
表2 各主题前20位主题词
Table 2 Top 20 subject words of each topic
Topic 0Topic 1Topic 2Topic 3Topic 4wastetechnologymaterialsolarcarbongasgreencellsystemforestbiomassenvironmentalusecontrolsinkprocessenergypropertyphotovoltaicmodelbiochardevelopmenthighpowerecosystemusepolicycompositeenergychangepyrolysisemissionstructuredeviceCproductioninnovationapplicationheatsystemsludgestudysurfacetechnologyareaproduceeconomicperformancemoduleclimatewatercarbonmethodcelllandsystemmodelperovskitelayeryearproductlow-carbonnanoparticlesefficiencyestimatematerialpapergreenintelligentstudytreatmentchangetechnologystoragebiomassreactorindustryfilmuseincreasecarboncountrystabilitytemperatureresultheatresultelectrodeunitfluxsolidanalysisoxidelightusemethodeffectcarbonsensorregionTopic 5Topic 6Topic 7Topic 8Topic 9catalystconnectadsorptionsoilbiochardegradationwaterbiocharmetalweightbiocharprovideremovalbiocharPtreactiondevicecapacityCdobtainactivityplatesurfaceheavymaterialcatalyticendmodelPbfertilizeracidsideadsorbentconcentrationaddmicrobialfixsolutioncontaminatewaterorganicbodyusereduceprepareoxidationrodPhremediationsolutionelectronutilitystudyCudrystudymodelsorptioneffectmethodenhancepipesystemZnsoil
续表2 各主题前20位主题词
Table 2(Continued) Top 20 subject words of each topic
Topic 5Topic 6Topic 7Topic 8Topic 9processframeaqueousamendmentmixreductionsupportgincreasepowdergrouppartwaterstudycompriseeffectbottomresultdecreaseacidsystemfirstCrsorptionCmechanismcomprisegreenresultdegreehighgreenmechanismplantagentTopic 10Topic 11Topic 12Topic 13Topic 14CsoilplantcarbontechnologybiocharbiochargrowthCO2energydegreeincreasesoilemissionusepyrolysiseffectseedincreasereviewtemperatureapplicationwatergassystembiocharsProotchangeresearchhighNseedlingcapturestudyincreaseamendmentsubstrateglobalenvironmentalproducetreatmentmediumCprocessbiomassusemethodcycleapplicationresultorganicuseclimatedesignpropertycompostimprovech4presentstudyadditionapplydioxidepapercontentrategrowgreenhousedevelopmentyieldstudyextractionpotentialapproachusecropleafreduceenvironmentcarbonyieldextractorganicgrowdifferentsignificantlynutrientsequestrationmethodcharresultstressoceanresultanalysiscontentCmusepotential
解读每个公共主题下的前20位代表词,总结得到每个公共主题代表领域的主题词,如表3所示。
表3 各领域主题词分布
Table 3 Distribution of subject words of various fields
主题主题词Topic 0生物质裂解生物炭技术Topic 1绿色碳排放技术政策Topic 2太阳能电池领域技术Topic 3光伏电力传感器技术Topic 4生态系统碳通量及气候环境介绍Topic 5生物炭活化技术Topic 6基于光伏技术的温室培育系统Topic 7生物炭吸附技术Topic 8生物炭改性材料制备技术Topic 9有机农业生物炭基肥料的制备技术Topic 10生物质热解生物炭技术Topic 11生物炭对作物氮吸收利用的影响Topic 12植物盐提取技术Topic 13全球海洋生物碳汇Topic 14工业实验环境教学指南
对CDTM模型公共主题识别结果,人工逐一判断,得到以下几个主题不是研究所需,将其作为垃圾主题舍弃。Topic 1的主题为绿色碳排放技术等政策对减碳的影响,本文不考虑政策以及经济方面对“双碳”领域的影响,因此将该主题舍弃。Topic 4是对森林生态系统碳通量及全球气候环境的综述性介绍,与本文研究“双碳”领域的技术无关,因此将其舍弃。Topic 11是生物炭与有机肥料结合使用对农作物氮吸收和利用的影响,主要探索生物炭使用对土壤环境的改善,进而增加粮食产量,在本文中不予考虑。Topic 13是对全球海洋生态系统碳汇和碳通量的综述性文章,与本文研究“双碳”领域的技术无关,因此将其舍弃。Topic 14是介绍工业实验环境安全的教学指南,与本文研究主题不符,将其舍弃。最终剩余10个主题用于识别“双碳”领域颠覆性技术。
(1)增长率指标。增长率指标通过计算每一主题当年与上一年的增长差异衡量技术增长情况。在CDTM模型中,特定于学术论文或专利m的研究主题k呈现出多项式概率分布根据此概率分布可以得到在一个时间段内,学术论文或专利在主题k中出现的概率pk,t,进而得到在t时期的增长率指标growthk,t=pk,t-pk,t-1。考虑到颠覆性技术新颖性的特点,本文将某一主题最近3年增长率的均值作为该主题的增长率指标值。
每项技术增长率指标的最终得分如表4所示。Topic 7主题的增长率最高,说明在这一时间段内该主题受到学者们较多关注并展开研究。Topic 0、Topic 9和Topic 10这3个主题的增长率也排在相对靠前的位置。而Topic 3的增长水平比较平缓,该主题没有被学者发现或认为有研究价值,因此没有继续研究,成为被“抛弃”的主题。总体来看,每一个主题下的技术大多在前5年还未被研究人员发现和研究,有的技术在近两年的研究中逐渐没落,都不是一经研究就受到关注和追捧的,有的主题会逐渐被“抛弃”,而有的主题会逐渐产生颠覆甚至推翻现有技术,成为新的主流技术。
表4 增长率指标得分
Table 4 Scores of growth rate index
主题增长率主题增长率Topic 061.122 76Topic 7174.095 13Topic 298.943 23Topic 859.953 86Topic 333.586 18Topic 964.259 57Topic 5112.109 93Topic 1095.864 35Topic 6139.471 78Topic 1242.755 51
(2)创新性指标。技术的创新性指标利用CIM模型判断论文或专利对前人研究的继承和突破,该模型假定每篇施引论文或专利仅受参考文献列表中被引论文或专利的影响,也就是说,模型采用一阶马尔可夫假设。使用Gibbs采样算法,将CIM模型的主题数固定为15,对称狄利克雷/贝塔分布先验α、δ和β、δ分别设置为0.5、0.01和0.5、0.01,Gibbs采样过程运行2 000次迭代。假设从CIM模型中获得参考文献或专利n对其施引文献或专利m继承或创新概率λm,0和λm,1,且λm,0+λm,1=1。然后,结合CDTM模型中每一篇施引文献或专利m对主题k的多项式分布ϑζ,m,得到主题k下的施引文献或专利m的创新性noveltym,k=λm,1×ϑζ,m,则整个主题的创新性
创新性指标Noveltyk的得分,如表5所示。同样,Topic 9、Topic 7、Topic 0和Topic 10的创新性Noveltyk得分均排在前五位,说明这几个主题没有过多继承之前发表的文献或专利,不同于其自身参考文献或专利的部分占更大比重。Topic 12主题则与之相反,文章的继承性相比而言更强,是对原有研究的继续深入挖掘,没有提出跳脱于其参考文献的思路或方法。
表5 创新性指标得分
Table 5 Innovation index scores
主题创新性主题创新性Topic 00.939 825Topic 70.955 576Topic 20.820 861Topic 80.827 750Topic 30.907 321Topic 90.986 312Topic 50.800 799Topic 100.902 307Topic 60.779 546Topic 120.778 540
(3)社会影响力指标。利用Google Trends数据,分析和统计某一关键词某一时期在谷歌搜索引擎中展示的搜索频率及其它相关统计数据,得到社会影响力指标值。运用CDTM模型获得每一主题k下的主题词m,在Google Trends网站检索2005—2021年的数据结果,得到频率pt,m,k,乘以共同主题中词的多项分布Φm,K,得到每一主题下某一时期的影响力则基于Google Trends搜索引擎的社会影响力指标Impactk即为每一时期影响力指标impactt,k的均值。
影响力指标Impactk综合考虑技术颠覆性对社会和学界产生的影响,技术会受到社会各界人士以及学术领域专家和权威机构的关注,该指标反映技术受到全世界关注的水平。影响力指标Impactk的得分如表6所示,Topic 6主题代表的技术影响力水平最高,得分为801.312 3,说明该主题在2005—2021年这个时间段受到全世界各国的关注最多,包括在Google浏览器的搜索以及Google Scholar中发布的文献等。Topic 9、Topic 0、Topic 7和Topic 10也都排在比较靠前的位置。Topic 8主题代表的技术影响力水平最低,说明这一主题没有受到学术界与社会各界的广泛关注,在这一时间段内缺乏发展潜力。
表6 影响力指标得分
Table 6 Impact index scores
主题影响力主题影响力Topic 0695.475 4Topic 7683.940 9Topic 2752.945 3Topic 8536.937 8Topic 3667.707 4Topic 9729.814 9Topic 5688.555 4Topic 10654.394 0Topic 6801.312 3Topic 12648.229 5
本文利用熵值法,对测度颠覆性技术的增长性指标、创新性指标和社会影响力指标进行客观赋权,加总得到颠覆性指数的最终得分。按照得分从大到小的顺序进行排名,从每种技术主题中选取1~2个技术术语代表该颠覆性技术的主题。
对上文中3个指标得分结果作熵值法分析,得到增长率指标、创新性指标、影响力指标的权重分别是0.38、0.45和0.17,计算最终加权数值,可得每一主题的颠覆性指数得分,如表7所示。
表7 颠覆性指数得分
Table 7 Disruption index scores
主题领域主题词 增长率得分创新性得分影响力得分总得分排名Topic 7生物炭吸附技术0.376 8950.389 5010.092 2930.858 6891Topic 9有机生物炭基肥料制备技术0.082 2770.457 1230.121 0940.660 4942Topic 0生物质裂解生物炭技术0.074 6680.354 8470.099 5350.529 0493Topic 10生物质热解生物炭技术0.167 0520.272 3030.073 7430.513 0984Topic 6基于光伏技术的温室培育系统0.284 0230.002 2140.165 9820.452 2195Topic 2太阳能电池领域技术0.175 3110.093 1120.135 6160.404 0396Topic 3光伏电力传感器技术00.283 3330.082 1010.365 4347Topic 5植物盐提取技术0.210 6290.048 9720.095 1900.354 7918Topic 8生物炭改性材料制备技术0.070 7280.108 26800.178 9959Topic 12生物炭活化技术0.024 59500.069 8720.094 46810
纵观所有技术颠覆性指数得分,可将颠覆性指数得分的阈值设置为0.5,故前4位技术Topic 7、Topic 9、Topic 0和Topic 10即为识别出的“双碳”领域颠覆性技术。根据主题中前20个主题词及相关文献梳理总结发现,Topic 7是生物炭吸附技术,用于提取和吸附,将碳资源合理储存以备其它用途,例如帮助农作物吸附营养物质等。Topic 9是关于有机农业生物炭基肥料的制备技术,用于改善土壤肥沃程度、降低土壤污染。Topic 0代表的是生物质裂解生物炭技术,通过产生生物炭的过程仿照大自然中煤炭、天然气以及石油等多个能源的生产反应,起到减碳的效果。Topic 10是生物质热解生物炭技术,通过矿化、化学等方式生成生物炭,能够合理利用碳。
根据改进后的CDTM模型抽取结果可知,上述4项颠覆性技术以论文和专利的形式出现的占比分别为52%和48%。其中,Topic 7和Topic 10更多以学术论文的形式呈现,在主题中分别占69.6%和73.4%;Topic 9和Topic 0则更多以专利数据的形式呈现,在主题中分别占71.2%和54.5%。获取这4项颠覆性技术所在主题频次排名前20的论文或专利数据,统计其公开发表年份以及研究人员所属国家,分析可知,“双碳”领域的颠覆性技术数量在2015年前后出现一个小高潮,随后有所回落,之后又在2019年崛起;从事相关领域研究的国家主要是中国和美国,分别是43项和14项,占所有颠覆性技术的71.3%,说明中美两国在“双碳”领域的研究占据优势地位。
4个“双碳”领域颠覆性技术中前20位论文或专利涉及的主要技术子领域以及每一子领域的数量如表8所示。纵观各领域主题,“生物炭”这一词汇频繁出现在各个主题中,生物炭是由天然生物质或农业废弃物在缺氧条件下经热化学转化而成的一类多孔碳质材料,生物炭的生产原料是各类废物,制备成本较低,其盈亏平衡价格是活性炭的1/6,且制备过程可以视作废弃物的一种资源化利用方式,因此,生物炭是一种极具前景的环境友好型CO2吸附材料[34]。识别出的几项颠覆性技术讨论研究了生物炭的生产制备、有效利用等,在使用肥料促进农业作物营养元素的吸收、提高粮食产量和减少煤炭等原始燃料使用等方面起到重要作用。
表8 颠覆性技术所涉及的子领域
Table 8 Subdomains involved in disruptive technologies
领域子领域数量生物炭吸附技术水溶液中的吸附14动热力的活性炭吸附6有机生物炭基肥料制备技术生物炭基肥料制备11生物炭基吸附、复合材料制备9生物质裂解生物炭技术生物质原料产生生物炭9生物炭做燃料的组合物6化学方法用生物炭制备燃料5生物质热解生物炭技术水热解生物炭15热化学热解生物炭5
自联合国欧洲经济委员会发布《碳捕获、利用与封存(CCUS)》报告后,CCUS技术已成为全球多个国家碳中和行动计划的重要组成部分。本文识别出的生物炭吸附技术和生物质热解生物炭技术,与CCUS技术中碳捕获技术分支的点源CCUS技术对应,将水泥和钢铁生产、化石燃料制氢、垃圾焚烧和发电等行业产生的CO2在排放到大气之前就进行捕获,然后压缩到超过100个大气压,注入到地下1 000m以下的多孔岩石层中,在不透水的岩石下,保存数万年到数百万年,使得产生的CO2在排放到大气之前就被捕获并封存。其中,有机生物炭基肥料制备技术对应碳捕获技术分支的生物质能碳捕获与封存技术,CO2由植被从大气中提取出来,然后在生物质燃烧时从燃烧产物中回收,或者通过化学反应合成其它高价值的清洁能源,在理想状态下加强土壤中的碳固存并最大限度减少工业化肥使用。生物质裂解生物炭技术对应碳捕获技术分支的直接空气碳捕获与封存技术,CO2由植被从大气中提取出来,直接从空气中捕获,该技术可以与地质封存技术结合,实现相对永久性固碳。识别出的4项颠覆性技术均能与国际认可的CCUS技术对应,由此也验证了本文方法和指标设计的可行性。
颠覆性技术的度量和识别研究,事关未来产业发展战略部署和科研人员研究方向,在日益激烈的国际竞争中,为国家抓住发展机遇提供强有力支持。本文以多源数据融合的形式,从学术论文、专利以及基于Google Trends数据的社会媒体数据出发,构建多源数据融合的颠覆性技术测度方法,进而对“双碳”领域的颠覆性技术进行度量和识别。首先,利用改进后的CDTM模型抽取公共主题,计算增长率指标;其次,结合CIM模型判断主题的继承与创新,计算创新性指标;最后,为弥补被引频次数据的滞后性问题,采用Google Trends收集的数据获取每一个主题的搜索量,计算社会影响力指标。进一步识别“双碳”领域的颠覆性技术,针对CDTM模型抽取和筛选出的10个主题,使用熵值法综合计算其颠覆性指数,认定指数得分高于0.5的主题为颠覆性技术。具体研究结论和启示如下:
(1)大数据时代的数据具有多样性,充分利用多源数据可全面度量颠覆性技术。颠覆性技术具有突破性、发展不确定性等特征,而当前研究仅限于学术界对科学数据集即学术论文数据和专利数据的引证研究,忽视了技术在促进社会进步、经济发展、教育水平提高等诸多领域的影响。本文所设计的颠覆性技术测度体系,采用的数据源更为丰富,包含论文数据、专利数据和替代计量学数据之一的Google Trends数据作为社会媒体数据的代表,既考虑了技术在学术界的影响,也兼顾了市场技术实用以及社会大众的接受情况。
(2)目前常用的主题提取方法有LDA、DIM、DTM等模型,但这些方法只能提取单个数据源的主题,无法兼顾多个数据源公共主题的提取。CDTM模型能最大限度地利用多个语料库之间的共享信息,不仅可以针对单数据源提取特有主题,还可以融合论文和专利数据获取多源数据的公共主题。本文使用改进后的CDTM模型,有效解决了“双碳”领域多源数据公共主题提取的问题,并克服了原始CDTM模型只能揭示各种资源选取相同特有主题数量的缺陷,可以得到较好的识别效果。最终,识别出的4项技术均与“生物炭”研究相关且与国际认可的CCUS技术相对应,进一步佐证了本文指标设计和识别方法的合理性。
(3)本文识别出的“双碳”领域颠覆性技术包括:生物炭吸附技术、有机生物炭基肥料制备技术、生物质裂解生物炭技术和生物质热解生物炭技术。相关研究在2015和2019年前后出现小高潮,中国和美国对相关技术的研究占据优势地位。我国应针对优势技术给予资源倾斜,继续深化技术创新,健全知识产权保护,加大技术推广力度,形成优势产业;针对“卡脖子”技术,需要对标世界核心技术开启赶超战略,增加基础学科研发投入,组建核心技术攻关团队,实现技术弯道超车,提高核心实力。
本研究有助于全面了解“双碳”领域的科技创新前沿,为未来产业发展战略部署、宏观政策的科学精准制定提供参考。针对识别出的4项“双碳”领域颠覆性技术,政府有关部门和相关企业应聚焦研发视角,合理配置资源,提高研发效率。在宏观调控方面,应健全多元化市场投入机制,鼓励社会资本以市场化方式进入颠覆性技术领域,设立基金为其提供资金支持;发挥税收政策激励作用,对颠覆性技术领域的企业实施税收优惠政策,减轻企业资金压力,提供低息贷款,筹措更多科研经费,使企业将精力更多投入到研发中;启动试点工作,通过以点带面的政策示范效应,充分调动各方创造性和积极性等;完善市场机制,采取降低或免征税赋、加强信贷等财政措施,着力解决技术成本高昂的问题;通过拉动投资,吸引企业家加入该领域,以利基市场为导向,促进新产业和新技术的出现。
本文构建了基于多源数据融合的颠覆性技术测度指标体系,充实了该领域理论研究,但关于影响力指标的设计仅考虑了社会媒体的影响,存在一定局限性。未来研究可进一步完善影响力指标,一方面补充选取更多的替代计量指标数据,减少社会媒体数据带来的扰动;另一方面与被引频次数据相结合,综合衡量技术在科学、技术和社会方面的影响力。另外,未来研究可在更多领域验证本文提出的多源数据融合的颠覆性技术度量和识别方法,针对面临的不足和缺陷加以改进,提高该方法的普适性。
[1] CHEN ZHUFENG. Study on modern automotive electronic technology characteristics and development trend[C]. Proceedings of the 2016 5th International Conference on Environment, Materials, Chemistry and Power Electronics,2016.
[2] CHRISTENSEN C M.The innovator′s dilemma:when new technologies cause great firms to fail [M]. Boston:Harvard Business Review Press,1997.
[3] SCHUMPETER A J.The theory of economic development: an inquiry into profits, capital, credit, interest, and the business cycle [M]. Boston: Harvard University Press,1934.
[4] 王康,陈悦.技术融合视角下基于专利的颠覆性技术识别研究[J].情报杂志,2022,41(4):29-36,134.
[5] DAHLIN K B, BEHRENS D M. When is an invention really radical? defining and measuring technological radicalness[J]. Research Policy, 2005, 34(5): 717-737.
[6] THOMOND P,LETTICE F.Disruptive innovation explored: 9th ipse international conference on concurrent engineering[J]. Research and Applications,2002,55(7):27-31.
[7] KENAGYJW, CHRISTENSENC M. Disruptive innovation: a new diagnosis for healthcare's "financial flu"[J]. Healthcare Financial Management,2002,56(6):62-66.
[8] 许佳琪,汪雪锋,雷鸣,等.从突破性创新到颠覆性创新:内涵、特征与演化[J].科研管理,2023,44(2):1-13.
[9] ARTHUR W. The structure of invention[J]. Research Policy,2007,36(2):274-287.
[10] VALLE S,D VAZQUEZ-BUSTELO.Concurrent engineering performance: incremental versus radical innovation [J]. International Journal of Production Economics, 2009, 119(1):136-148.
[11] MANYIKA J, CHUI M, BUGHIN J. Disruptive technologies: advances that will transform life, business, and the global economy[R].China Beijing, McKinsey Global Institute,2013.
[12] 孙永福,王礼恒,孙棕檀,等.引发产业变革的颠覆性技术内涵与遴选研究[J].中国工程科学, 2017, 19(5):9-16.
[13] REINHARDT R, S GURTNER. The overlooked role of embeddedness in disruptive innovation theory[J]. Technological Forecasting and Social Change, 2018,132(2): 268-283.
[14] 李欣, 黄鲁成. 技术路线图方法探索与实践应用研究——基于文献计量和专利分析视角[J]. 科技进步与对策,2016,33(5):62-72.
[15] CARLSEN H, DREBORG K H, GODMAN M, et al. Assessing socially disruptive technological change[J]. Technology in Society,2010,32(3):209-218.
[16] KLENNER P, HUSIG S, DOWLING M. Ex-ante evaluation of disruptive susceptibility in established value networks:when are markets ready for disruptive innovations[J]. Research Policy, 2013, 42 (4):914-927.
[17] LIU X, WANG X, et al. Identifying disruptive technologies by integrating multi-source data[J]. Scientometrics,2022,127(2):5325-5351.
[18] TUGRUL U DAIM, GUILLERMO RUEDA, HILARY MARTIN, et al. Forecasting emerging technologies: use of bibliometrics and patent analysis[J]. Technological Forecasting &Social Change,2006,73(8):981-1012.
[19] FEFIE DOTSIKA,ANDREW WATKINS. Identifying potentially disruptive trends by means of keyword network analysis[J]. Technological Forecasting &Social Change,2017,119(6):114-127.
[20] XU SHUO, HAO LIYUAN, AN XIN, et al. Emerging research topics detection with multiple machine learning models[J]. Journal of Informetrics,2019,13(4):1-19.
[21] XU XUEMING, LI JICHAO, JIANG JIANG, et al. A disruptive technology identification method based on multisource data: take unmanned aerial vehicle systems as an example[C]. 7th International Conference on Big Data and Information Analytics (BigDIA), 2021.
[22] XU S, LI L, AN X, et al. An approach for detecting the commonality and specialty between scientific publications and patents[J]. Scientometrics ,2021,126(7):7445-7475.
[23] CHANGYONG LEE, OHJIN KWON, MYEONGJUNG KIM, et al.Early identification of emerging technologies: a machine learning approach using multiple patent indicators[J]. Technological Forecasting and Social Change,2018,127(2):291-303.
[24] BUCHANAN B, CORKEN R. A toolkit for the systematic analysis of patent data to assess a potentially disruptive technology[R]. London: Intellectual Property Office,2010:2-16.
[25] CAROLIN MUND, PETER NEUHAUSLER. Towards an early-stage identification of emerging topics in science:the usability of bibliometric characteristics[J]. Journal of Informetrics, 2015,9(4): 1018-1033.
[26] 刘忠宝,康嘉琦,张静.基于主题突变检测的颠覆性技术识别——以无人机技术领域为例[J].科技导报,2020,38(20):97-105.
[27] WANG QI. A bibliometric model for identifying emerging research topics[J]. Journal of the Association for Information Science and Technology, 2018,69(4):290-304.
[28] DIETZ, LAURA, STEFFEN BICKEL,et al. Unsupervised prediction of citation influences[C]. International Conference on Machine Learning,2007.
[29] BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3(1): 993-1022.
[30] GERRISH S M, BLEI D M. A language-based approach to measuring scholarly impact[C]. Proceedings of the 27th International Conference on Machine Learning, 2010.
[31] BLEI D M, LAFFERTY J D. Dynamic topic models[C].Proceedings of the 23rd International Conference on Machine Learning, 2006.
[32] HUA T, LU C-T, CHOO J, et al. Probabilistic topic modeling for comparative analysis of document collections[J]. ACM Transactions on Knowledge Discovery from Data, 2020,14(24):1-24.
[33] DAVID M BLEI, ANDREW Y NG, MICHAEL I JORDAN. Latent dirichlet allocation[J]. The Journal of Machine Learning Research,2003,3(3):993-1022.
[34] 李经宽,曲孟青,张圆圆,等.生物炭CO2吸附剂的制备和改性研究进展[J].燃料化学学报,2023,15(7):882-895.