数据要素应用对企业双元创新的影响研究

刘亚洲,扈文秀,吴邦海,王芳云

(西安理工大学 经济与管理学院,陕西 西安 710054)

摘 要:数字经济时代,数据已成为驱动企业技术创新和可持续发展的关键生产要素。企业如何有效利用数据要素以提升创新能力,从而增强竞争优势,是学术界与业界关注的重要议题。基于资源基础观与创新管理理论,系统分析其对企业利用式创新与探索式创新的影响机制,采用2008—2023年中国A股上市企业面板数据,构建双重固定效应模型进行实证检验。研究发现,数据要素应用对企业双元创新具有显著正向影响,且对利用式创新的影响更为突出。机制分析表明,数据要素应用通过激活内部冗余资源促进利用式创新,通过增强外部研发合作推动探索式创新。此外,大数据综合试验区设立与东部地区经济优势进一步强化数据要素应用对双元创新的促进作用。研究深化了资源基础理论在数据要素背景下的解释力,为政府完善数据要素市场制度和企业提升数据利用能力提供实践启示。

关键词:数据要素应用;利用式创新;探索式创新;冗余资源;研发合作

The Impact of Data Factor Application on Corporate Ambidextrous Innovation

Liu Yazhou, Hu Wenxiu, Wu Banghai, Wang Fangyun

(School of Economics and Management, Xi'an University of Technology, Xi'an 710054, China)

Abstract:In the era of the digital economy, data has evolved from an auxiliary information resource into a core production factor driving technological innovation and sustainable development. Understanding how data factor empowers firms to achieve balanced exploitative and exploratory innovation,thus enhancing their ambidextrous innovation capability,has become an essential question in both academic research and policy practice. Existing research primarily examines corporate innovation through the lenses of digital economy, digital transformation, and digital technology application, spanning macro, industrial, and digital capability levels. Recent studies have begun to explore the nexus between data factor and corporate innovation, highlighting their promotional effects, potential risks, and relevant theoretical models. However, significant deficiencies persist regarding mechanisms, contextual factors, and theoretical integration. Specifically, research on data factor and corporate ambidextrous innovation exhibits three major gaps: first, a lack of systematic characterization based on micro-level firm data; second, insufficient elaboration on how data factor embeds within the innovation process and exert differential impacts; and third, inadequate empirical testing that incorporates external environmental dynamics and firm heterogeneity, thereby limiting the generalizability of conclusions and practical implications.

Thus, this study aims to systematically explore the mechanisms and boundary conditions through which the application of data factor influences firms' innovation performance in both exploitative and exploratory dimensions. Grounded in the resource-based view and innovation management theory, this paper constructs a dual-path framework of “stock resource activation” and “incremental resource integration”. It argues that data factor application can stimulate exploitative innovation by identifying and activating slack internal resources, while promoting exploratory innovation by strengthening external R&D collaboration networks. To empirically test these mechanisms, a two-way fixed effects model is established using panel data from 3 076 Chinese A-share listed firms between 2008 and 2023, yielding 29 900 firm-year observations. The level of data factor application is measured through text mining of corporate annual reports across four dimensions: data stock, data development capability, data-driven business applications, and data monetization. Exploitative and exploratory innovation are distinguished by patent classification continuity, with slack resources and R&D collaboration as mediating variables.

Empirical results show that the application of data factor significantly promotes both exploitative and exploratory innovation, with a stronger effect on exploitative innovation, suggesting that data utilization primarily enhances incremental rather than radical innovation. Mechanism analysis confirms two distinct transmission paths: data factor application reduces slack resources by improving resource recognition, allocation, and utilization efficiency, thereby enhancing exploitative innovation; simultaneously, it facilitates exploratory innovation by optimizing partner identification, collaboration modes, and knowledge integration efficiency, underscoring the role of data in enabling heterogeneous resource synergy. Heterogeneity analysis shows that these effects are more pronounced under favorable institutional and regional conditions. Specifically, the establishment of national big data pilot zones and the economic advantages of eastern China significantly strengthen the positive relationship between data factor application and dual innovation outcomes.

This study makes three primary contributions. First, it advances micro-level research on data factor by integrating them into the analysis of firm-level innovation behavior, extending the theoretical frontier of data economy studies. Second, it deepens the understanding of how data-driven processes reshape firms' resource allocation mechanisms, providing empirical evidence that data applications can transform slack resources into innovation assets and foster cross-organizational knowledge recombination. Third, it identifies the heterogeneous effects of institutional environments and regional development levels, offering new insights into how data infrastructure and policy design can enhance firms' innovation capability.

From a managerial perspective, the findings suggest that firms should strengthen their data management and analytics capabilities to embed data-driven decision-making throughout innovation activities. For exploitative innovation, data can be used to optimize internal processes and accelerate incremental improvement; for exploratory innovation, big data and collaborative platforms can help identify emerging opportunities and reduce innovation uncertainty. Policymakers are advised to accelerate data market reforms, promote cross-regional data circulation, and build supportive institutional frameworks,especially in underdeveloped areas,to ensure equitable access to data-driven innovation opportunities.

Key WordsData Factor Application; Exploitative Innovation; Exploratory Innovation;Slack Resources; R&D Collaboration

收稿日期:2025-07-03

修回日期:2025-10-14

基金项目:国家社会科学基金重点项目(25AJY002)

作者简介:刘亚洲(1999-),男,河南安阳人,西安理工大学经济与管理学院博士研究生,研究方向为数据要素应用、企业创新;扈文秀(1964-),男,河南长垣人,博士,西安理工大学经济与管理学院教授、博士生导师,研究方向为数据要素应用;吴邦海(2001-),男,陕西安康人,西安理工大学经济与管理学院硕士研究生,研究方向为技术创新;王芳云(1995-),女,甘肃平凉人,西安理工大学经济与管理学院博士研究生,研究方向为技术创新。

通讯作者:扈文秀。

DOI:10.6049/kjjbydc.D82025070056

开放科学(资源服务)标识码(OSID):

中图分类号:F273.1; F49

文献标识码:A

文章编号:1001-7348(2026)06-0022-10

0 引言

随着信息技术持续发展和广泛应用,数字经济逐渐成为引领中国经济增长的重要引擎。中国信息通信研究院发布的《中国数字经济发展研究报告(2024年)》显示,“2023年,数字经济增长对GDP增长的贡献率达66.45%,数字经济有效支撑经济稳增长”。2019年10月党的十九届四中全会提出,“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”。2022年12月《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出,“充分认识和把握数据产权、流通、交易、使用、分配、治理、安全等基本规律,探索有利于数据安全保护、有效利用、合规流通的产权制度和市场体系”。随着制度体系逐步完善与政策支持不断加码,数据要素的潜能持续释放,正成为驱动我国数字经济高质量发展的重要动力。数据要素的核心特征包括虚拟性、非竞争性、非排他性、低复制成本、外部性与即时性[1-3]。上述特征使其被广泛嵌入各类业态和模式,成为资源配置的新基准:在微观层面支持企业生产与消费决策,在中观层面促进产业发展,在宏观层面提升资源配置效率[4]。因此,数据要素嵌入既为企业创新提供重要支撑,也契合国家对创新能力建设的战略要求。在企业层面,创新活动通常被划分为利用式创新与探索式创新。前者强调在既有资源与能力基础上的技术、产品或流程改进,以保持市场份额和经营稳定性[5];后者聚焦新技术、新产品或新领域突破,以获取长期竞争优势[6]。二者相辅相成,共同构成企业双元创新体系[7]。在数据要素被确立为新型生产要素、企业创新能力建设被提升至国家战略高度的背景下,深入探讨数据要素应用对企业双元创新的影响,具有重要理论价值与实践意义。

现有文献多从数字经济、数字化转型或数字技术应用等视角探讨企业创新,大体分为3类:一是从宏观层面分析数字经济发展对企业创新绩效与创新能力的影响[8-11];二是从产业层面考察数字化转型对创新质量、效率及绿色创新的作用[12-15];三是从数字能力视角研究数字技术应用对研发创新的促进作用[16-20]。近年来,部分学者开始探讨数据要素与企业创新的关系。有学者指出,数据要素通过优化资源配置或吸引人才促进企业创新[21];也有学者提出,企业在数据应用中可能面临“要素陷阱”[22],并构建数据要素与双元创新理论模型[23]。总体而言,上述研究仍存在机制单一、情境局限和理论整合不足等问题。

综上,关于数据要素与企业双元创新的研究存在以下不足:第一,多数研究仅停留在宏观或产业层面,缺乏基于企业微观数据的系统刻画;第二,对数据要素如何嵌入创新过程的阐释不够深入,缺少对不同创新类型差异化作用的解释;第三,缺乏结合外部环境与企业异质性的系统检验,研究结论的推广与实践价值有限。基于此,本文构建以数据要素应用为核心变量的研究框架,利用2008—2023年中国A股上市公司面板数据,实证分析数据要素应用对企业双元创新的影响,并从冗余资源与研发合作两个维度深入剖析其作用机制。

本文边际贡献如下:第一,以微观企业为研究对象,基于双元创新理论,将企业创新活动划分为利用式创新和探索式创新,并构建数据要素应用影响企业双元创新的作用机制模型,检验其对两类创新的影响及其差异性,以拓展数据要素研究在企业创新领域的理论边界。第二,基于资源基础理论,结合利用式创新和探索式创新在资源利用方面的差异性,从内部冗余与外部研发合作维度,探讨其在数据要素应用影响企业双元创新过程中的中介作用,以丰富二者间的作用机制研究。第三,将数据要素市场建设程度与地区发展水平纳入研究框架,更加全面地探讨数据要素应用对企业双元创新的异质性影响,以期为企业创新能力培养与数据要素市场建设提供参考。

1 理论分析与研究假设

1.1 数据要素应用与企业双元创新:影响效应分析

作为数字经济的核心资源,数据要素因其可复制、可共享、可无限供给特征,可加速数字技术扩散与应用[24],拓展现有创新理论边界[25]。不同类型创新活动对数据要素的依赖特征存在显著差异。利用式创新侧重于对既有产品、技术和流程的优化,更依赖与现有业务相关、结构化程度高且实时性强的数据信息,以降低改进过程中的不确定性,提高资源利用效率;探索式创新侧重于新技术、新市场和新模式突破,更依赖跨领域、多源异质性和非结构化数据,以识别潜在机会、感知技术前沿,支持高风险探索。

数据要素应用在企业创新活动中发挥多维度作用。在研发决策方面,结构化数据(如客户行为、历史销售、工艺参数)契合市场需求,能够提升利用式创新的精确性[26],而非结构化与跨领域数据(如技术趋势、专利数据库、用户生成内容)则为探索式创新提供前瞻性支持。在动态能力方面,数据与数字技术结合有助于企业在既有业务中快速响应市场变化、保持竞争稳定性,进而促进利用式创新(谢康等,2020);同时增强企业在新兴领域识别机会、整合资源的能力,为探索式创新提供条件。在商业应用方面,数据要素驱动的模式创新既推动流程优化、供应链精益化和精准营销,从而强化利用式创新,又借助大数据与人工智能催生新型商业模式,拓展探索式创新空间[24]。在资源利用方面,数据要素应用支持企业识别并再配置冗余资源(如闲置专利、低利用率设备),提升利用式创新效率,同时有助于企业通过数据交易、专利引进和产学研合作等方式获取外部知识与技术,从而缩短研发周期并提升探索式创新成功率。基于此,本文提出如下假设:

H1a:数据要素应用对企业利用式创新具有正向影响;

H1b:数据要素应用对企业探索式创新具有正向影响。

1.2 数据要素应用与企业双元创新:作用机制分析

1.2.1 冗余资源的中介作用:存量资源激活效应

资源基础理论认为,冗余资源可被转化利用,用以实现组织目标、提升组织绩效,并对企业长期成长产生重要影响。一方面,作为备用性资源,冗余资源能够为企业提供缓冲空间与战略灵活性,使企业在面对复杂竞争态势时更从容地制定战略与研发决策,进而对企业发展产生积极影响[27-28]。另一方面,大量冗余资源可能导致企业满足于现状,削弱外部压力感知与市场变化响应能力,阻碍战略调整与创新活动,进而对企业发展产生不利影响[29-31]。冗余资源通常与企业既有业务领域高度契合,在产品改进、工艺优化和流程优化等利用式创新活动中具有直接投入潜力。适度冗余资源可为利用式创新提供必要的资金、设备与人力支持,降低在既有技术路径上进行优化的风险与不确定性,从而加快改进速度并提高成功率。基于这一特性,数据要素应用可为企业进一步识别、激活并利用冗余资源,进而提升利用式创新水平提供新的实现路径,具体从冗余资源识别、资源优化配置以及资源利用效率提升3个方面展开。

在冗余资源识别方面,数据要素应用能够支持企业基于经营数据进行精准分析,明确不同业务环节资源需求,识别并量化内部冗余资源[32]。同时,数据要素及时、准确传递可提升部门间信息透明度[26],以及资源识别与跨部门分配的精确性,从而强化企业对内部资源动态的把控能力。在资源优化配置方面,数据要素应用能够通过整合和筛选企业生产与管理过程中的海量数据,实现资源在不同业务单元、生产环节间的有效配置与组合,进而提升资源配置效率(韦庄禹,2022)。在资源利用效率方面,数据要素应用能够提升企业管理者对市场需求、技术趋势和内部运作的洞察力,从而更精准地确定冗余资源的最佳投放方向,拓展其在既有技术路径上的利用深度与广度[33]。这种高效利用能够加快存量资源价值转化,进而持续推动利用式创新。此外,数据要素应用能够通过提升信息传递的及时性与透明度,降低资源配置过程中的信息不对称,从源头上减少无效冗余,进一步释放利用式创新潜力。基于此,本文提出如下假设:

H2:数据要素应用对冗余资源具有负向影响。

H3:冗余资源在数据要素应用与企业利用式创新间发挥中介作用。

1.2.2 研发合作的中介作用:增量资源整合效应

资源基础理论认为,异质性资源是企业获得持续竞争优势的关键。如何有效获取并培育支撑企业长期发展的特殊资源,是现代企业战略管理研究关注的核心问题之一。随着信息和数字技术普及,企业间合作频率与深度不断提升,逐渐形成以单个企业为节点、跨越组织边界的创新网络,不同主体在其中深化交流、互补优势并交换所需的异质性资源。异质性资源和知识在创新网络间流通,有助于催生新的创意和促进技术突破,从而推动创新成果生成与扩散。一类观点认为,研发合作有助于企业获取多样化创新资源。尤其在以研发新技术、新产品为目标的探索式创新中,仅依靠内部存量资源,企业往往难以突破既有技术路径限制[9]。通过与外部主体建立合作网络,企业可补充所需的异质性资源,拓展技术边界,并提高探索式创新成功率[34]。另一类观点强调研发合作在风险分担上的功能。由于探索式创新具有高度不确定性和较高的投资风险,在面临市场竞争与外部压力时,企业通过合作机制可实现风险共担与收益共享,从而降低研发成本与失败风险(祝建辉等,2022)。

探索式创新强调技术与产品的突破性发展,对外部异质性资源的依赖程度较高。数据要素应用可为企业加强外部合作、获取异质性资源以支撑探索式创新提供新的实现路径,具体从合作对象识别、合作模式变革以及合作效率提升3个方面展开:在合作对象识别方面,数据要素应用能够支持企业利用大规模市场与行业数据,快速发现并评估潜在合作伙伴的资源与能力结构,从而实现有针对性的研发合作匹配[9]。在合作模式变革方面,数据要素的虚拟性与共享性特征能够突破地域与时间限制,推动跨地域、跨时区高效协作,促使研发合作从传统线下集中模式向分布式、实时化协同模式转变。在合作效率提升方面,数据要素的快速流通特性能够加速创新信息与知识传递,增强合作各方知识整合与转化能力,从而缩短研发周期,提高研发成果转化率。高效研发合作网络能够在较短时间内整合多方技术优势,增强探索式创新的突破潜力。基于此,本文提出如下假设:

H4:数据要素应用对研发合作具有正向影响。

H5:研发合作在数据要素应用与企业探索式创新间发挥中介作用。

综上所述,本文构建概念模型如图1所示。

图1 理论模型
Fig.1 Theoretical model

2 研究设计

2.1 样本与数据来源

本文使用数据主要包括上市公司财务数据、发明专利数据和数据要素应用指标数据。其中,上市公司财务数据主要来自国泰安数据库(CSMAR)和万德(Wind)数据库,发明专利数据来自中国研究数据服务平台(CNRDS),数据要素应用指标数据主要来自上市企业年报文本。以2008—2023年中国A股上市企业作为初始样本,并对数据进行如下处理:第一,剔除金融行业样本;第二,剔除当年被ST、*ST和PT的样本;第三,剔除重要指标数据缺失过多的样本;第四,剔除财务指标数据明显异常的样本;第五,对所有连续变量进行1%的缩尾处理。最终得到包含78个行业,3 076家企业,共29 900个“企业—年份”观测样本。

2.2 变量定义

2.2.1 被解释变量:双元创新

借鉴Guan等[35]的方法,以IPC分类号前4位为依据,选择5年作为窗口期,采用企业前5年专利分类号的集合代表当前企业所处技术领域。若企业当年申请的某项专利,其IPC分类号在企业前5年专利类别中,则该专利为利用式专利;若企业当年申请的某项专利,其IPC分类号不在企业前5年的专利类别中,则该专利为探索式专利。对两类专利分别计数并取对数,以此作为衡量利用式创新(DI)和探索式创新(EI)的代理变量。

2.2.2 解释变量:数据要素应用(Data)

数据作为新型生产要素,目前理论界与实践界未对其刻画方法和统计标准形成一致结论。为合理、准确衡量企业层面数据要素应用水平,同时兼顾数据要素特征和演化过程,本文采用文本分析法,通过Python程序抓取上市公司年报中与数据要素应用相关的关键词并计算关键词总词频,以此构建企业数据要素应用指数。参考唐要家等[8]的研究,本文对企业层面数据要素开发利用指数的特征词词谱进行词频统计,该特征词词谱主要从数据要素存量、数据开发能力、数据驱动商业应用和数据价值变现4个维度选取关键词(见表1),具有较高参考价值。

表1 特征词词谱
Table 1 Spectrum of feature words

维度关键词数据要素存量大数据、数据集成、数据融合、数据信息、数据管理、数据资产、数字化数据开发能力自动化、5G、智能、机器人、机器学习、3D打印、3D技术、3D工具、AI、物联网、边缘计算、云计算、云服务、云端、数字科技、数字技术、计算机技术、信息时代、信息化、信息技术、信息集成、信息通信数据驱动商业应用O2O、B2B、C2C、P2P、C2B、B2C、电子技术、电子科技、线上、网络、线上线下、互联网、电子商务、跨境电商、电商平台、智慧时代、智慧建设、智慧业务、数字运营、数字终端、数字经济、数字体系、数字供应链、数字营销数据价值变现数字货币、区块链、数字贸易

2.2.3 中介变量:冗余资源(RRE)、研发合作(CRI)

企业利用已有资源进行技术创新,本质上是挖掘现有资源、提升资源利用效率并减少冗余资源的过程。参考史青春等[33]的研究,采用企业财务指标数据,对流动比率、权益负债率、收入费用比进行算术平均,以此作为企业冗余资源的代理变量。借鉴李健等[36]的研究,结合实际情况,将企业与外部主体联合申请专利的行为作为研发合作的代理变量。若企业当年联合申请专利数量不为零,则认为企业参与研发合作,记为1,否则记为0。

2.2.4 控制变量

为控制企业层面因素对双元创新的影响,参考马淑琴等[21]、姜英兵等[37]的研究,本文所选控制变量如下:企业规模(Size)、企业年龄(Age)、企业性质(SOE)、两职合一(Dual)、股权集中度(Top1)、资产负债率(LEV)、资产收益率(ROA)、营业成本率(OCR)、固定资产比率(FIXED)。主要变量定义见表2。

表2 主要变量测度
Table 2 Measurement of key variables

变量类型变量名称衡量方式被解释变量利用式创新(DI)在前5年专利分类号中的专利申请数加1取对数探索式创新(EI)不在前5年专利分类号中的专利申请数加1取对数解释变量数据要素应用(Data)相关关键词词频总数加1取对数中介变量冗余资源(RRE)流动比率、权益负债和收入费用比之和的算数平均数研发合作(CRI)若企业当年联合申请专利数不为零,取值为1,否则为0控制变量企业规模(Size)总资产取自然对数企业年龄(Age)企业年龄加1取自然对数企业性质(SOE)若企业属于国有企业,取值为1,否则为0两职合一(Dual)若董事长兼任总经理,取值为1,否则为0股权集中度(Top1)第一大股东持有的流通股股数除以总流通股股数资产负债率(LEV)总负债除以总资产资产收益率(ROA)净利润除以总资产营业成本率(OCR)营业成本除以营业收入固定资产比率(FIXED)固定资产净额除以总资产

2.3 模型构建

2.3.1 主效应模型

为探究数据要素应用对企业双元创新的影响效应,本文构建基准模型如下:

DIi,t=α0+α1Datai,t+∑Controli,t+μi+δt+εi,t

(1)

EIi,t=α0+α1Datai,t+∑Controli,t+μi+δt+εi,t

(2)

其中,因变量DIi,tEIi,t分别为企业利用式创新和探索式创新,核心解释变量Datai,t为企业层面数据要素应用指标,∑Controli,t表示控制变量集合,μiδt分别为企业和年份固定效应,εi,t表示随机扰动项,若α1显著,则假设H1a和H1b成立。

2.3.2 中介效应模型

借鉴温忠麟等[38]的研究,本文采用三步法进行检验。为验证冗余资源在数据要素应用与利用式创新间的中介作用,设定模型如下:

RREi,t=β0+β1Datai,t+∑Controli,t+μi+δt+εi,t

(3)

DIi,t=β0+β1Datai,t+β2RREi,t+∑Controli,t+μi+δt+εi,t

(4)

为验证研发合作在数据要素应用与探索式创新间的中介作用,设定模型如下:

CRIi,t=γ0+γ1Datai,t+∑Controli,t+μi+δt+εi,t

(5)

EIi,t=γ0+γ1Datai,t+γ2CRIi,t+∑Controli,t+μi+δt+εi,t

(6)

同理,需要保证模型(2)中α1显著为正且模型(5)中γ1显著为正,在此前提下可进一步验证研发合作的中介作用。若模型(6)中的γ2显著,且γ1相较于模型(2)中α1不显著或显著但系数减小,则假设H5成立,说明研发合作在数据要素应用对企业探索式创新影响过程中发挥中介作用。当γ1不显著时,研发合作在二者间发挥完全中介作用;当γ1显著但系数减小时,研发合作在二者间发挥部分中介作用。

3 实证结果与分析

3.1 描述性统计

表3报告了本文变量描述性统计结果。在被解释变量方面,利用式创新的最大值为7.318,最小值为0,均值为2.459;探索式创新的最大值为4.007,最小值为0,均值为1.359。整体上,利用式创新和探索式创新的相关数据均呈现均值偏低的特点。进一步对比两类数据发现,探索式创新的最大值和均值均小于利用式创新。在解释变量方面,数据要素应用指数的取值范围为0.693~6.538,均值为3.407,标准差为1.356,表明不同企业数据要素在应用水平上存在较大差异。

表3 描述性统计结果(N=29 900)
Table 3 Descriptive statistics(N=29 900)

变量均值标准差最小值最大值DI2.4591.98207.318EI1.3591.17404.007Data3.4071.3560.6936.538RRE1.3541.4030.24312.247CRI0.4130.49201Size22.4621.30219.41526.452Age3.0090.2891.7923.689SOE0.4600.49801Dual0.2240.41701Top10.3320.1480.0780.758LEV0.4700.2000.0280.908ROA0.0260.068-0.5560.222OCR0.7370.230-0.15425.501FIXED0.2200.1680.0010.772

3.2 主效应检验

为验证数据要素应用对企业双元创新的影响,本文对模型(1)(2)进行回归分析,结果见表4。由表4列(3)(6)可知,数据要素应用的回归系数分别为0.118和0.091,均在1%水平上显著为正,说明数据要素应用对利用式创新和探索式创新均具有正向影响,H1a和H1b得以验证。在控制其他变量对利用式创新和探索式创新的影响后,相较于探索式创新,数据要素应用对利用式创新的促进作用更强。由表4列(1)(4)可知,在未加入控制变量和固定效应的情况下,数据要素应用的系数分别为0.544和0.178,呈现正向效应,且该效应在1%水平上显著,初步说明数据要素应用对企业双元创新具有正向影响。在逐步加入控制变量和固定效应后,数据要素应用的系数在1%水平上显著为正,进一步证明回归结果的可靠性。由表4列(2)(5)可知,在加入控制变量但未加入固定效应时,数据要素应用的系数分别为0.489和0.177,且均在1%水平上显著。

表4 基准回归结果
Table 4 Baseline regression results

变量DI(1)(2)(3)EI(4)(5)(6)Data0.544∗∗∗0.489∗∗∗0.118∗∗∗0.178∗∗∗0.177∗∗∗0.091∗∗∗(69.334)(60.924)(11.867)(36.313)(34.283)(9.434)Size0.607∗∗∗0.414∗∗∗0.293∗∗∗0.243∗∗∗(66.985)(31.973)(50.341)(19.380)Age-0.360∗∗∗0.612∗∗∗-0.320∗∗∗-0.340∗∗∗(-10.327)(4.875)(-14.284)(-2.802)SOE-0.104∗∗∗0.076∗∗0.0190.011(-4.699)(2.193)(1.326)(0.343)Dual0.101∗∗∗0.061∗∗∗-0.0030.012(4.129)(3.215)(-0.194)(0.633)Top1-0.752∗∗∗-0.055-0.236∗∗∗0.115(-10.384)(-0.625)(-5.066)(1.360)LEV-0.813∗∗∗-0.086-0.279∗∗∗-0.161∗∗∗(-13.749)(-1.539)(-7.346)(-2.969)ROA1.766∗∗∗0.229∗∗0.870∗∗∗0.385∗∗∗(10.984)(2.171)(8.426)(3.781)OCR0.763∗∗∗0.0280.459∗∗∗0.002(16.821)(0.863)(15.729)(0.061)FIXED0.529∗∗∗0.328∗∗∗0.427∗∗∗0.045(8.597)(4.537)(10.815)(0.643)Constant0.607∗∗∗-11.829∗∗∗-9.682∗∗∗0.753∗∗∗-5.118∗∗∗-3.778∗∗∗(21.097)(-59.688)(-23.353)(41.908)(-40.199)(-9.421)个体固定效应NONOYESNONOYES年份固定效应NONOYESNONOYESN29 90029 90029 90029 90029 90029 900R20.1390.2840.3230.0420.1570.125

注:*、**、***分别表示在10%、5%和1%的置信水平上显著,()内为t值,下同

3.3 稳健性检验

3.3.1 替换被解释变量

为验证前文实证结果和模型的稳健性,本文重新选取企业双元创新衡量指标,借鉴相关研究,采用实用新型专利和外观设计专利申请数加1的自然对数衡量利用式创新[23],采用发明专利申请数加1的自然对数衡量探索式创新[39],检验结果表5所示。表5列(1)(2)报告了数据要素应用对企业双元创新的直接效应检验结果,数据要素应用的系数均在1%水平上显著为正。由此表明,数据要素应用对企业双元创新具有正向影响,H1a和H1b得以验证。

表5 稳健性检验结果
Table 5 Robustness test results

变量替换被解释变量DIEI(1)(2)缩短样本年限DIEI(3)(4)Data0.120∗∗∗0.124∗∗∗0.125∗∗∗0.102∗∗∗(6.911)(7.861)(6.704)(6.465)Constant-9.216∗∗∗-10.040∗∗∗-6.064∗∗∗-2.179∗∗(-11.342)(-12.388)(-5.566)(-2.560)控制变量YESYESYESYES个体固定效应YESYESYESYES年份固定效应YESYESYESYESN29 90029 90017 72817 728R20.2910.3070.1730.107

3.3.2 缩短样本年限

在实证研究中,样本选取的时间范围对实证结果可能产生一定影响。当样本期内存在特殊周期或发生极端事件时,研究结果的可靠性会降低。本文选取的样本区间为2008—2023年,存在两段特殊时期,分别为2008年后的国际金融危机和2019年后的新冠疫情。这两段时期内,中国经济发展受挫,企业经营陷入困境。为控制样本期内极端事件对研究结果的影响,本文对样本区间进行调整,借鉴唐要家等[8]、马淑琴等[21]的研究,分别剔除2008—2011年数据和2020—2023年数据重新进行估计,检验结果如表5所示。由表5列(3)(4)可知,剔除外生冲击的影响后,检验结果与前文结果一致,表明研究结论具有稳健性。

3.4 内生性检验

为进一步探究数据要素应用与企业双元创新间可能存在的互为因果问题,本文借鉴董瑶等[40]的研究,将滞后一期数据要素应用水平作为工具变量(DT_LV),采用两阶段最小二乘估计方法进行回归分析。表6列(1)为第一阶段工具变量对内生变量影响的结果,系数为0.552且在1%水平上显著,说明工具变量与内生变量间具有较强的相关性。表6列(2)(3)报告了第二阶段回归结果,解释变量相关系数分别为0.213、0.093,均在1%水平上显著为正,与基准回归结果一致,证明结论的稳健性。此外,过度识别检验结果显示,Kleibergen-Paap rk LM统计量在1%水平上显著,拒绝工具变量识别不足的原假设。弱工具变量检验结果显示,Kleibergen-PaapWald rk F和Cragg-DonaldWaldF的F值均大于1%水平上的临界值,进一步验证本文工具变量的有效性。

表6 内生性检验结果
Table 6 Endogeneity test results

变量DataDIEI(1)(2)(3)DT_LV0.552∗∗∗(53.17)Data0.213∗∗∗0.093∗∗∗(6.16)(3.53)控制变量YESYESYES个体固定效应YESYESYES年份固定效应YESYESYESKleibergen-PaaprkLM统计量542.87∗∗∗Kleibergen-Paap Wald rk F2 826.87∗∗∗统计量[16.38]Cragg-Donald Wald F统计量10 331.38∗∗∗[16.38]R2—0.3030.117N24 93224 93224 932

3.5 中介效应检验

3.5.1 冗余资源的中介作用

为验证数据要素应用与利用式创新间的作用路径,参考温忠麟等[38]的研究,本文选用三步法检验冗余资源在二者间的中介作用,模型(3)(4)的检验结果如表7所示。由列(1)可知,主效应成立;由列(2)可知,数据要素应用的系数为-0.043,在1%水平上显著为负,表明数据要素应用对冗余资源具有负向影响,H2得到验证。在此基础上,对冗余资源的中介效应进行检验,加入冗余资源这一中介变量后,列(3)显示,数据要素应用的系数为0.116,在1%水平上显著为正;冗余资源的系数为-0.033,在1%水平上显著为负,表明数据要素应用能够通过降低冗余资源存量提高企业对已有资源的利用效率,进而对利用式创新发挥正向影响,H3得到验证。

表7 中介效应检验结果
Table 7 Mediation effect test results

变量DI(1)(2)(3)EI(4)(5)(6)Data0.118∗∗∗-0.043∗∗∗0.116∗∗∗0.091∗∗∗0.020∗∗∗0.081∗∗∗(11.867)(-5.741)(11.722)(9.434)(5.083)(8.590)RRE-0.033∗∗∗(-3.984)CRI0.479∗∗∗(32.986)Sobel检验0.001 4∗∗∗0.009 7∗∗∗(Z=3.273)(Z=5.024)Goodman检验10.001 4∗∗∗0.009 7∗∗∗(Z=3.240)(Z=5.022)Goodman检验20.001 4∗∗∗0.009 7∗∗∗(Z=3.307)(Z=5.026)中介效应系数0.001 4∗∗∗0.009 7∗∗∗(Z=3.273)(Z=5.024)直接效应系数0.116 5∗∗∗0.080 9∗∗∗(Z=11.722)(Z=6.114)中介效应比例0.011 90.107 2控制变量YESYESYESYESYESYES个体固定效应YESYESYESYESYESYES年份固定效应YESYESYESYESYESYESN29 90029 90029 90029 90029 90029 900R20.3230.3500.3230.1250.0950.159

3.5.2 研发合作的机制作用

为验证数据要素应用与探索式创新间的作用路径,模型(5)(6)的检验结果如表7所示。由列(4)可知,主效应成立;由列(5)可知,数据要素应用的系数为0.020,在1%水平上显著为正,表明数据要素应用对研发合作具有正向影响,H4得到验证。此基础上,对研发合作的中介效应进行检验,加入研发合作这一中介变量后,列(6)显示,数据要素应用的系数为0.081,在1%水平上显著为正;研发合作的系数为0.479,在1%水平上显著为正。由此说明,数据要素应用能够通过加强企业与其他创新主体间的研发合作,强化企业获取异质性资源的能力,进而对探索式创新发挥正向作用,H5得到验证。

4 异质性分析

4.1 数据要素市场环境

企业所处外部环境差异会对企业双元创新产生影响。数字经济发展背景下,国家高度重视数据产业发展战略布局。2016年,在京津冀等七个区域推进国家大数据综合试验区建设。借助试验区政策优势、资源集聚效应以及完善的产业配套设施,企业可高效获取数据资源,并深度挖掘数据价值,形成以数据驱动为核心的创新模式。为探究国家大数据综合试验区设立前后,数据要素应用对双元创新的影响差异,本文以大数据综合试验区设立时间为节点,将研究样本划分为设立前和设立后两组进行回归分析,以揭示不同外部环境下数据要素应用与企业双元创新的动态关系。

表8报告了大数据综合试验区设立前后,数据要素应用对利用式创新和探索式创新的回归结果。结果显示,相较于大数据综合试验区设立前,大数据综合试验区设立后数据要素应用对利用式创新和探索式创新的回归系数在1%水平上显著为正。为确保分组检验结果的可靠性,本文采用费舍尔组合检验比较分组回归后的系数差异,设定随机自抽样次数为1 000次,得到经验P值作为衡量两组回归系数差异的参考。当P值小于设定的显著性水平时,可认为分组回归后的解释变量系数在两组间存在显著差异。检验结果显示,大数据综合试验区设立前后的组间差异值分别为-0.169、-0.111,且均在1%水平上显著,表明大数据综合试验区设立前后的组间差异具有统计显著性。

表8 数据市场环境异质性分析结果
Table 8 Heterogeneity analysis results of the data market environment

变量DI设立前设立后(1)(2)EI设立前设立后(3)(4)Data-0.005 0.164∗∗∗0.017 0.128∗∗∗(-0.252) (7.362)(0.897)(6.364)Constant-8.320∗∗∗ -6.036∗∗∗-7.237∗∗∗-0.800(-5.773)(-4.185)(-6.076)(-0.659)个体固定效应YESYESYESYES年份固定效应YESYESYESYESN10 54319 35710 54319 357R20.2010.1770.0580.106组间系数差异检验-0.169∗∗∗-0.111∗∗∗

检验结果表明,大数据综合试验区设立后,数据要素应用对利用式创新和探索式创新的作用更为显著,这一结果从一定程度上反映出大数据综合试验区设立所带来的积极成效。在大数据综合试验区设立前,数据要素应用对利用式创新和探索式创新作用不显著的原因可能在于:在内部资源整合方面,大数据综合试验区设立前,由于缺乏相关技术储备,企业数据整合能力不足,难以对数据进行加工处理,无法获取高质量数据资源,进而限制数据要素的创新协同效应。在外部资源获取方面,大数据综合试验区设立前,数据资源难以在创新主体间自由流通,企业无法通过数据交易获取创新资源。在产业层面,大数据综合试验区设立前,企业对数据要素的认知有限,由于缺乏政策引导,限制数据应用场景开发,难以形成产业层面的创新驱动力。

4.2 宏观经济发展水平

企业所在地区经济发展水平也会对企业双元创新产生影响。一般而言,经济发展水平较高地区往往在基础设施、金融市场、人才储备等方面具备更强的资源禀赋优势,能够为企业获取和利用外部资源创造有利条件,有助于企业获得更多机会。上述因素共同作用于企业创新成效,并对其长期发展产生一定影响。我国经济发展势头总体较好,但不同区域间经济发展水平存在差异,在资源禀赋、企业规模结构以及企业数量分布等方面呈现不均衡。相较于中西部地区,我国东部地区通常拥有更为完善的基础设施、金融市场以及更为丰富的人才储备。为探究不同地区间数据要素应用对利用式创新和探索式创新的影响差异,本文依据企业所处地区,将研究样本划分为东部地区企业和中西部地区企业进行检验。

表9报告了不同地域组别研究样本中,数据要素应用对利用式创新和探索式创新的回归结果。结果显示,相较于中西部地区企业样本,东部地区企业样本中,数据要素应用(Data)的回归系数更大,且均在1%水平上显著为正。组间系数差异检验结果显示,东部地区样本与中西部地区样本组间差异值分别为-0.062、-0.061,分别在5%和10%水平上显著,表明东部地区样本和中西部地区样本组间差异具有统计显著性。相较于中西部地区企业样本,数据要素应用对东部地区企业利用式创新与探索式创新的促进作用更为显著,原因如下:第一,东部地区企业数量较多,样本基础较好;第二,东部地区经济发展水平较高,具备更为突出的资源禀赋优势。这意味着,在较完善的经济与资源环境支持下,东部地区企业能够更高效地获取与利用创新所需外部资源。因此,在数据要素应用水平以及基于数据要素开展研发创新的能力方面,东部地区企业均优于中西部地区企业。

表9 地区异质性分析结果
Table 9 Regional heterogeneity analysis results

变量DI东部中西部(1)(2)EI东部中西部(3)(4)Data0.132∗∗∗0.070∗∗0.093∗∗∗0.075∗∗∗(6.227)(2.239)(5.777)(3.338)Constant-8.937∗∗∗-11.681∗∗∗-3.384∗∗∗-5.522∗∗∗(-7.769)(-7.265)(-4.540)(-5.517)个体固定效应YESYESYESYES年份固定效应YESYESYESYESN19 9689 93219 9689 932R20.2950.3730.1220.135组间系数差异检验-0.062∗∗-0.061∗

5 结语

5.1 研究结论

数字经济时代,数据要素应用水平反映企业应用数据资源创造经济价值的能力,对企业技术创新与持续发展具有深远影响。本文以2008—2023年我国A股上市公司为研究对象,系统梳理数据要素应用与企业双元创新的关系,并进一步探究数据要素应用对企业双元创新的影响路径,得出以下主要研究结论:

(1)数据要素的应用对企业探索式创新和利用式创新均具有显著正向影响,且对利用式创新的促进作用更为显著。

(2)数据要素应用通过存量资源激活和增量资源整合两条路径驱动企业双元创新。实证结果表明,数据要素应用能够提升企业识别、匹配和利用资源的能力,通过挖掘冗余资源潜在创新价值,提高资源利用效率并降低冗余存量,推动利用式创新,从而验证“数据要素应用—冗余资源—利用式创新”的传导机制;数据要素应用通过精准匹配资源、优化研发合作模式和提升创新效率,促进研发合作网络形成,增强企业获取异质性资源的能力,推动探索式创新,从而验证“数据要素应用—研发合作—探索式创新”的传导机制。

(3)受企业所处外部环境影响,数据要素应用对不同类型企业双元创新的影响效果存在差异。具体而言,数据要素应用对双元创新的影响效应在国家大数据综合试验区设立后更加显著;相较于中西部地区,数据要素应用对双元创新的影响效应在东部地区更加显著。

5.2 管理启示

(1)加强数据要素应用能力建设,推动其与企业创新体系深度融合。在利用式创新中,通过构建覆盖数据采集、处理、分析与转化的全链条机制,利用数据分析提升现有技术与工艺精度及稳定性;在探索式创新中,通过数据洞察识别潜在市场需求与技术前沿,实现新产品持续产出,从而促进双元创新协同发展。

(2)优化不同创新类型数据赋能路径,提升数据要素在创新活动中的资源配置效率。针对利用式创新的存量资源特征,利用数据要素强化冗余资源识别、优化与再利用,降低资源闲置率并加快改良速度;针对探索式创新的外部异质性知识需求,通过数据要素精准匹配合作对象、创新合作模式与提升跨组织协同效率,提高技术突破的可能性与创新成功率。

(3)提升外部环境差异下的数据要素配置适配性,以及不同区域和政策条件下的创新成果产出效率。在国家大数据综合试验区,依托政策优势、基础设施和数据资源先发条件,加快跨产业与跨区域数据流通及利用;在东部地区,发挥产业集聚与人才优势,扩大开放共享的创新网络规模,提升数据配置效率与成果转化率;在中西部地区,完善数字基础设施,构建跨区域数据与技术协作平台,逐步缩小与东部地区在数据驱动创新能力方面的差距。

5.3 不足与展望

本文存在以下不足:一方面,基于年报文本分析构建数据要素应用指标,虽能反映企业数据利用水平,但未细分结构化数据与非结构化数据及其在不同业务环节的差异化作用,后续可结合企业数据治理实践和多源异构数据作进一步分析。另一方面,本研究基于冗余资源与研发合作视角揭示作用机制,未充分考虑组织学习、管理能力及数字战略等因素影响,未来可结合多层次模型或案例研究方法,进一步拓展数据要素驱动双元创新的动态机制。

参考文献:

[1] 徐翔, 厉克奥博, 田晓轩. 数据生产要素研究进展[J]. 经济学动态, 2021, 62(4): 142-158.

[2] 李海舰, 赵丽. 数据成为生产要素: 特征、机制与价值形态演进[J]. 上海经济研究, 2021, 33(8): 48-59.

[3] 蔡跃洲, 马文君. 数据要素对高质量发展影响与数据流动制约[J]. 数量经济技术经济研究, 2021, 38(3): 64-83.

[4] 谭洪波, 耿志超. 数据要素推动经济高质量发展路径研究——基于新生产要素特征视角的分析[J]. 价格理论与实践, 2023, 43(9): 46-51.

[5] 白秀伟, 程德俊, 郭飞燕. 双元创新的动态配置: 高管损益关注与机会—威胁认知分类的组合效应[J]. 科技进步与对策, 2025, 42(11): 41-50.

[6] BENNER M J,TUSHMAN M L.Exploitation,exploration,and process management:the productivity dilemma revisited[J].The Academy of Management Review,2003,28(2):238-256.

[7] 李瑞雪, 彭灿, 吕潮林, 等. 双元创新协同性与企业可持续发展: 竞争优势的中介作用[J]. 科研管理, 2022, 43(4): 139-148.

[8] 唐要家, 王钰, 唐春晖, 等. 数字经济、市场结构与创新绩效[J]. 中国工业经济, 2022, 40(10): 62-80.

[9] 李健, 张金林, 董小凡, 等. 数字经济如何影响企业创新能力: 内在机制与经验证据[J]. 经济管理, 2022, 44(8):5-22.

[10] 宝胡日查, 陈池波, 潘经韬, 等. 数字经济发展对涉农企业创新投入的影响研究[J]. 农业经济与管理, 2024, 15(2): 52-65.

[11] 郑雨稀, 杨蓉. 数字经济与企业创新: 基于创新需求的视角[J]. 科技管理研究, 2022, 42(10): 11-19.

[12] 师磊, 彭子晨. 企业数字化转型对其创新效率的影响——基于熊彼特创新范式的分析框架[J]. 中国农村经济, 2024, 40(4): 99-119.

[13] 刘冰冰, 刘爱梅. 数字化转型、要素配置和企业创新效率[J]. 经济体制改革, 2023, 41(5): 121-128.

[14] 李云鹤, 吴文锋. 数字化转型能否助力我国制造业企业创新提质增效[J]. 社会科学, 2023, 45(9): 107-122.

[15] 滕明明, 申明浩. 数字化同群效应如何影响企业创新投入——一个有调节的中介模型[J]. 科技进步与对策, 2023, 40(12): 23-31.

[16] 郭爱君, 徐莺歌, 杨春林. 数字技术、产业结构与城市创新质量的非线性关系——基于中国282个城市的实证研究[J]. 经济问题探索, 2025, 46(4): 90-106.

[17] 惠树鹏, 王卓. 数字化对高技术产业创新投入的影响——基于研发创新与非研发创新的比较[J]. 科技进步与对策, 2024, 41(22): 80-88.

[18] 李容达, 何婧. 数字技术应用与企业创新: 机制识别与约束条件[J]. 金融理论与实践, 2023, 45(2): 9-23.

[19] 李伟红, 董帆, 李恩极. 数字化水平对企业创新活动的影响研究——基于创新网络视角[J]. 河北经贸大学学报, 2023, 44(5): 36-45.

[20] 陈蕊, 王宏伟. 大数据发展与企业创新能力提升[J]. 当代经济管理, 2024, 46(5): 30-42.

[21] 马淑琴, 徐苗, 张陈宇. 数据要素应用与企业创新效应——来自中国A股上市公司的经验证据[J]. 商业经济与管理, 2024, 44(2): 50-67.

[22] 徐翔, 赵墨非, 李涛, 等. 数据要素与企业创新: 基于研发竞争的视角[J]. 经济研究, 2023, 58(2): 39-56.

[23] 李黎, 雍会, 王磊, 等. 数据要素嵌入、双元创新与制造业转型升级[J]. 统计与信息论坛, 2024, 39(4): 31-45.

[24] 陈丽莉, 张若琪, 戎珂. 数据要素赋能企业创新: 基于内外部资源视角[J]. 管理评论, 2024, 36(12): 15-25.

[25] NAMBISAN S, LYYTINEN K, MAJCHRZAK A, et al. Digital innovation management: reinventing innovation management research in a digital world[J]. MIS Quarterly, 2017, 41(1): 223-238.

[26] 王宏伟, 董康. 数据要素对企业发展的影响——基于云计算行业197家上市公司实证分析[J]. 东岳论丛, 2022, 43(3): 161-173, 192.

[27] BOURGEOIS L J. On the measurement of organizational slack[J]. The Academy of Management Review, 1981, 6(1): 29-39.

[28] 王超发, 郭宏, 杨德林. 创新方式会影响企业投资价值吗——基于冗余资源的调节效应验证[J]. 统计研究, 2020, 37(7): 3-14.

[29] JENSEN M C, MECKLING W H. Theory of the firm: managerial behavior, agency costs and ownership structure[J]. Journal of Financial Economics, 1976, 3(4): 305-360.

[30] CHENG J L C, KESNER I F. Organizational slack and response to environmental shifts: the impact of resource allocation patterns[J]. Journal of Management, 1997, 23(1): 1-18.

[31] VANACKER T, COLLEWAERT V, ZAHRA S A. Slack resources, firm performance, and the institutional context: evidence from privately held European firms[J]. Strategic Management Journal, 2017, 38(6): 1305-1326.

[32] LATILLA V M M, URBINATI A, CAVALLO A, et al. Organizational re-design for business model innovation while exploiting digital technologies: a single case study of an energy company[J]. International Journal of Innovation and Technology Management, 2021, 18(2): 2040002.

[33] 史青春, 牛悦, 徐慧. 企业数据要素利用水平影响投资效率机理研究——利用数据要素激活冗余资源的中介作用[J]. 中央财经大学学报, 2023, 43(11): 105-115.

[34] 曹艳华, 姜丽璇, 周键. 中小企业创新网络、资源拼凑与创新绩效——被调节的中介模型[J]. 管理现代化, 2021, 41(6): 62-68.

[35] GUAN J C, LIU N. Exploitative and exploratory innovations in knowledge network and collaboration network: a patent analysis in the technological field of nano-energy[J]. Research Policy, 2016, 45(1): 97-112.

[36] 李健, 董小凡, 张金林, 等. 数据资产对企业创新投入的影响研究[J]. 外国经济与管理, 2023, 45(12): 18-33.

[37] 姜英兵, 徐传鑫, 班旭. 数字化转型与企业双元创新[J]. 经济体制改革, 2022, 40(3): 187-193.

[38] 温忠麟, 叶宝娟. 中介效应分析: 方法和模型发展[J]. 心理科学进展, 2014, 22(5): 731-745.

[39] 吴珊, 张金隆, 高沛然, 等. 智能制造企业复合双元创新能力模型研究[J]. 管理学报, 2024, 21(12): 1830-1837.

[40] 董瑶, 张樨樨, 易涛. 数字化转型、合作伙伴动态性与企业双元创新[J]. 山西财经大学学报, 2023, 45(2): 102-115.

(责任编辑:张 悦)