“制度—技术—市场”框架下公共数据开放对数实融合的驱动效应研究

徐向龙1,2,赵 星3

(1.铜陵学院 管理学院,安徽 铜陵 244061;2.华东师范大学 商业分析上海市级实验教学示范中心,上海 200062;3.南京师范大学 商学院,江苏 南京 210023)

摘 要:深化公共数据开放、释放其要素价值、赋能数字经济与实体经济深度融合,是加快培育新质生产力、实现高质量发展的关键路径。构建“制度—技术—市场”整合性理论框架,系统揭示区域公共数据开放过程中的制度环境构建、技术创新赋能和数据要素市场塑造功能,以及公共数据开放驱动数实融合的内在机理。基于2010—2023年中国285个地级市面板数据,利用专利共分类法构建区域数实融合水平测度指标,运用双重机器学习模型进行实证检验。研究发现:①公共数据开放能显著促进城市数实融合水平提升,并通过改善区域制度环境、提升数字技术创新和数据要素市场化水平间接驱动数实融合。②进一步分析发现,这种驱动效应存在显著异质性,在公共数据开放质量高的城市以及高活力与低活力城市显著,而在公共数据开放质量较低及中等活力城市不显著。③空间效应分析表明,公共数据开放有助于缩小省内中心城市与外围城市的数实融合差距,在“胡焕庸线”东侧,中心地区对邻接城市表现出显著虹吸效应,在“胡焕庸线”西侧则没有显著影响。据此,提出深化公共数据开放、促进数实融合发展的政策建议。

关键词:公共数据开放;数实融合;数字经济;专利共分类法;双重机器学习

The Driving Effects of Public Data Openness on Digital-Real Economy Integration under the Institution-Technology-Market Framework

Xu Xianglong1,2, Zhao Xing3

(1.School of Management, Tongling University, Tongling 244061, China;2.Shanghai Municipal Experimental Teaching Demonstration Center for Business Analytics, East China Normal University, Shanghai 200062, China;3.School of Business, Nanjing Normal University, Nanjing 210023, China)

Abstract:The deep integration of the digital and real economies promotes high-quality development, and occupies a central position in national development strategies. As an authoritative and foundational resource, public data, when opened, serves as a critical enabler for overcoming market failures associated with data scarcity and high acquisition costs. Consequently, understanding how public data openness affects digital-real integration and the underlying mechanisms involved is of paramount importance. Nevertheless, significant gaps remain. Current studies lack a systematic investigation of the cross-sectoral and cross-regional transmission channels linking public data openness to digital-real integration, provide insufficient analysis of regional heterogeneity, and rely on measurement frameworks and empirical strategies,such as subjectively weighted indices and conventional difference-in-differences models.

This study constructs an integrated “institution-technology-market” analytical framework to systematically explain the tripartite mechanisms through which regional public data openness drives digital-real integration by enhancing the institutional environment, empowering technological innovation, and developing the data factor market.The study uses panel data from 285 Chinese cities from 2010 to 2023 to measure regional digital-real integration through an objective patent co-classification method and applies double/debiased machine learning to address endogeneity and model misspecification risks. The results show that public data openness significantly promotes urban digital-real integration, with effects operating indirectly through improved institutional quality, accelerated digital technology innovation, and enhanced marketization of data factors. Heterogeneity analysis reveals that these effects are concentrated in cities with high-quality data openness and in both high- and low-vitality urban contexts, while remaining insignificant in cities with low-quality openness and medium vitality. Spatially, public data openness reduces the digital-real integration gap between core and peripheral cities within provinces. However, east of the Hu Huanyong Line, central cities exert significant siphoning effects on adjacent areas, whereas no such effects are observed to the west.

This paper makes three main contributions. First, theoretically, it moves beyond single-dimensional perspectives on public data openness such as institutional optimization, resource provision, or innovation catalysis by developing and validating a three-dimensional integrated framework that captures the synergistic interactions among institutional construction, technological empowerment, and market-shaping attributes. This addresses the literature’s underemphasis on the multifaceted nature of public data. Second, methodologically, it introduces patent co-classification and double machine learning to overcome the subjectivity inherent in existing integration metrics and the restrictive assumptions of conventional models (e.g., Difference-in-Differences, DID). This approach enables objective, technology-based quantification of regional integration and provides a robust, semi-parametric paradigm for causal inference. Third, empirically, it extends beyond urban hierarchy differences to examine heterogeneity boundaries and spatial spillovers, testing convergence effects within provincial core-periphery structures and spatially differentiated impacts across urban agglomerations on either side of the Hu Huanyong Line.

Policy recommendations are advanced across three pillars. Institutionally, governments should refine implementation rules for data openness,covering classification standards, open lists, and authorized operation models,to create trusted data spaces and reduce enterprise compliance costs. Establishing quality evaluation and feedback mechanisms, aligning openness with digital government initiatives, and fostering a shared-governance culture through innovation competitions will further enhance private-sector digital investment. Technologically, high-quality public datasets and platforms must be developed with rigorous cleaning and annotation standards to ensure usability. R&D in frontier technologies (e.g., AI, blockchain, privacy computing) should be intensified to lower application thresholds, while benchmark scenarios in areas such as intelligent manufacturing and smart logistics should be created to amplify technology spillovers. Marketization of data factors requires exploring authorized public data operations, cultivating diverse entities (e.g., data exchanges, data banks, data trusts), and implementing the “Data Element ×” action plan to integrate public data with industry and social data. This will support industrial Internet platforms in developing integrated services (e.g., supply chain finance) and building healthy platform ecosystems.

Key WordsPublic Data Openness;Digital-Real Economy Integration;Digital Economy;Patent Co-classification Method;Double Machine Learning

收稿日期:2025-07-27

修回日期:2025-12-03

基金项目:国家自然科学基金项目(72304144);安徽省教育厅重点科研项目(2025AHGXSK30387);安徽省高校哲学社会科学研究项目(2023AH010058);铜陵学院人才科研启动基金项目(2024tlxyrc047)

作者简介:徐向龙(1989—),男,安徽池州人,博士,铜陵学院管理学院副教授,华东师范大学商业分析上海市级实验教学示范中心研究员,研究方向为数字经济与企业技术创新;赵星(1991—),男,江西赣州人,博士,南京师范大学商学院副教授,研究方向为技术创新与经济增长。

DOI:10.6049/kjjbydc.D9N202507118

开放科学(资源服务)标识码(OSID):

中图分类号:F49

文献标识码:A

文章编号:1001-7348(2026)09-0138-12

0 引言

党的二十大强调,“加快发展数字经济,促进数字经济和实体经济深度融合”。数实融合是大数据、人工智能和物联网等数字技术与数字经济模式在传统产业中应用与扩散,通过激活数据要素资源配置与创新赋能,重构实体经济生产方式、组织形态和商业模式,实现全要素生产率跃升的系统性变革[1]。数字经济与实体经济深度融合不仅是推动传统产业转型升级的核心动力,更是构建现代化经济体系、加快培育新质生产力、实现高质量发展的关键路径[2]。数据作为一种新型生产要素,通过精准映射现实经济运行,驱动智能决策和优化资源配置,成为数字经济与实体经济融合的基础[1]。公共数据是各级政府部门及公共机构在履行法定职责或提供公共服务过程中产生、收集和管理的数据资源,具有权威性、基础性和覆盖广等独特价值[3],其开放共享能够有效破解市场数据稀缺与高成本难题,对经济社会运行产生重要影响。当前,释放公共数据要素价值已成为全球共识,我国政府从顶层设计和制度保障方面着力推进公共数据开放进程。公共数据开放如何影响数实融合,其作用机制如何?对这些问题进行研究,有助于深入揭示公共数据开放驱动数实融合的内在逻辑与边界条件,为优化公共数据开放政策、深化数字经济与实体经济融合提供理论依据与实践指引。

已有文献主要从制度优化、资源供给和创新催化等方面对公共数据开放经济效应进行分析。一是提升社会运行效率,公共数据开放有助于提高政府透明度和治理能力,提升决策科学化、治理精准化和服务便利化水平,增强市场主体信任度与合作意愿,为数据要素市场培育和数实融合生态提供制度保障[4-5]。二是提供公共数据资源,公共数据开放能够降低市场主体,尤其是中小企业获取关键信息的门槛,弥补企业数据不足的短板,为其产品研发、服务优化和商业模式创新提供低成本、高可信度的公共数据资源[6-7]。三是激发市场创新活力,公共数据开放有助于推动数据要素市场流动,促进资本跨地域流动和城市创业,催生基于数据融合分析的创新应用,推动传统产业技术升级与流程再造,培育新兴数据驱动型产业[8-9]

随着数实融合进程的不断深入,学术界围绕其影响因素和测度方法展开系统性研究。在影响因素方面,政策驱动、技术创新与市场机制多维协同构成数实融合的关键动力。研究表明,“宽带中国”[10]、政府数据开放[11]、智慧城市建设[12]及大数据综合试验区等相关政策[13]驱动数实融合进程。在技术创新层面,5G和人工智能等数字技术应用为数实融合提供基础支撑[14-15]。在市场机制层面,要素配置效率对数实融合具有显著影响,而对外贸易[12]和数字金融等因素则为数实融合提供外部市场动力。在测度方法方面,耦合协调模型是当前主流测度范式,学者多通过构建数字经济与实体经济子系统指标体系,采用熵值法赋权并计算耦合协调度,用以度量数实融合水平,而专利共分类法为分析数实融合强度提供了新视角[16]

已有研究从多角度揭示公共数据开放对经济社会发展的积极影响,且部分研究从公共数据资源供给和数据交易共享制度保障层面探讨公共数据开放对数实融合的作用机制[11],但对公共数据开放驱动数实融合的系统性研究存在以下不足:首先,现有研究多聚焦公共数据开放对微观企业或产业的经济效应,缺乏系统考察其对数字经济与实体经济深度融合跨产业、跨区域传导机制,未能全面揭示其在复杂系统融合过程中的作用路径。其次,对公共数据开放区域异质性的探讨不足,城市发展水平和资源禀赋差异对数实融合效果可能存在显著差异,但对公共数据开放质量和平台建设水平异质性影响的探讨较少。最后,已有研究多基于耦合协调模型构建数实融合测度指标,并采用双重差分法(DID)进行实证分析,存在指标设计主观性强和计量模型适用条件严苛等不足[16-17]

本文构建“制度—技术—市场”整合分析框架,系统揭示公共数据开放驱动数实融合的内在机理,并基于专利共分类法构建区域数实融合测度指标,运用双重机器学习方法实证检验公共数据开放对区域数实融合的影响作用,以及城市等级、公共数据开放质量和空间效应的异质性。本文创新之处在于:第一,在理论框架上,不同于已有研究多从制度优化、资源供给或创新催化等单一维度探讨公共数据开放产生的影响效应,本文构建“制度—技术—市场”三维整合分析框架,系统揭示公共数据开放通过其内生制度构建、技术赋能与市场塑造属性共同驱动数实融合的复杂机理,可弥补现有文献对公共数据开放多重属性及其协同效应关注的不足。第二,研究方法上,针对既有数实融合测度指标主观性较强和DID等传统计量模型适用性局限,本文引入专利共分类法与双重机器学习模型开展实证研究,基于客观专利数据从技术层面量化区域数实融合强度,克服主观构建指标体系偏误,并利用双重机器学习模型灵活的半参数特征,能有效规避模型误设风险,为识别公共数据开放对数实融合影响的净效应提供更为客观、稳健的因果推断范式。第三,研究视角上,现有研究虽关注公共数据开放驱动效应中的城市等级差异,但对其异质性边界及空间外溢性的探讨较少。本文从空间维度实证检验公共数据开放在省内中心城市与外围城市的趋同效应,以及在“胡焕庸线”两侧城市群中的空间异质效应,可为制定差异化区域协同政策提供新的经验依据。

1 政策背景与理论分析

1.1 政策背景

公共数据开放是深化数字政府建设与数字经济发展的重要战略举措,其发展脉络可概括为3个阶段。一是地方试点探索期,2012年上海市政府数据服务网试运行,标志着公共数据开放从理念倡导转向实践探索。此后,天津、浙江、广东等地陆续跟进,但数据开放范围有限,多聚焦于交通和医疗等民生服务类数据,平台建设标准和数据质量参差不齐(方锦程等,2023)。二是国家战略统筹期,2015年国务院印发《促进大数据发展行动纲要》,首次将政府数据开放共享纳入国家战略,明确要求构建统一开放平台。随后,《“十四五”数字经济发展规划》《关于加强数字政府建设的指导意见》等政策相继出台,强调通过数据互联互通,打破“数据孤岛”和“数据烟囱”,推动公共数据资源体系化建设。三是制度深化与场景拓展期,2022年《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出数据基础制度的“四梁八柱”;2023年国家数据局组建,着力强化数据要素统筹管理的顶层设计;《“数据要素×”三年行动计划(2024—2026年)》则进一步明确公共数据在产业治理领域的赋能目标。

当前,公共数据开放呈现总量扩张与质量提升并存、区域差异与领域分化共生的特征。数据平台建设规模方面,复旦大学数字与移动治理实验室联合国家信息中心数字中国研究院发布的《2025中国地方公共数据开放利用报告》显示,截至 2025年7月,我国已有26个省级和231个市级地方政府上线了数据开放平台。长三角、珠三角等经济发达地区实现省域全覆盖,但西北、东北地区仍存在显著区域差距。数据供给质量方面,数据开放覆盖面不断扩大,涵盖经济运行、社会治理、民生服务等十二大类,且部分地区已实现从“基础数据开放”向“场景化数据服务”转型。如上海推出“交通数据开放专区”支持智能交通应用,但多数地区仍以静态政务数据开放为主,动态更新机制尚未建立。

1.2 理论分析

作为释放公共数据价值的重要举措,公共数据开放不仅是一个技术工程,更是涉及制度设计、技术支撑与数据要素市场培育的系统性治理创新[18]。随着公共数据开放进程的日益深化,其兼具的制度、技术与市场三重属性不断凸显。本文基于制度理论、技术赋能理论和数据要素市场理论,构建一个“制度—技术—市场”整合分析框架,系统揭示区域公共数据开放对数实融合的驱动效应,如图1所示。

图1 公共数据开放驱动数实融合的整合框架
Fig.1 Integration framework of public data openness driving digital-real economy integration

1.2.1 公共数据开放驱动数实融合的制度构建机制

制度理论认为,规制、规范与认知三大支柱共同构成组织行为塑造与经济绩效提升的制度环境[19]。公共数据开放本质上是一场深刻的制度变革,核心在于通过重构数据治理规则体系与协同模式,为市场主体参与数实融合创建稳定、可预期与共享共治的制度环境。

(1)公共数据开放相关规制性制度的建立,降低了市场制度性交易成本。通过出台数据开放条例和实施细则等规章制度,明确公共数据权属、开放范围和使用权限等规则,为公共数据要素市场化流通奠定了合法性基础。这不仅会降低企业获取和利用公共数据的合规成本[20-21],也促使政府部门打破“数据孤岛”,推动跨部门协同与流程再造,间接减少企业在行政审批与合规证明等环节的时间与经济成本[8],使其能够将更多资源投向数实融合技术研发与场景应用等创新活动。

(2)公共数据开放增强了规范性制度的透明度,营造了公平竞争的市场环境。透明数据开放本身就是政府公信力的体现,有助于增强市场主体信任度与合作意愿。开放信用监管和行政审批等公共数据能够有效缓解市场主体信息不对称[22],抑制寻租空间,提升政策执行可见度与可预期性,从而增强实体企业进行长期数字化投资的意愿[23-24]

(3)公共数据开放促进认知性制度转变,推动政府从单向垄断数据治理模式向多元共治数据共享模式转型,促使政府、企业和研究机构等多元主体围绕数据价值挖掘与融合应用形成协作网络[18,21],释放协同治理模式的制度创新红利。例如,通过开放交通数据,吸引科技企业开发智慧物流解决方案,将人口迁徙数据融入城市规划,可提升社会治理水平。由此,公共数据开放推动制度环境变革,促进数字技术在实体场景中快速迭代与深度渗透。

1.2.2 公共数据开放驱动数实融合的技术赋能机制

技术赋能理论强调,技术不仅是提升组织效率的手段,更是重构其生产模式与创新路径的重要能力[25]。公共数据开放通过提供关键数据要素赋能数字技术创新与扩散,是驱动数实融合的核心引擎。

(1)公共数据作为基础性战略资源,为区域数字技术创新与场景应用提供关键要素输入。大规模、高质量公共数据是训练先进人工智能算法和优化模型性能的基石[26],其开放共享能够降低市场主体尤其是中小企业获取和利用复杂公共数据的技术门槛与成本[27]。同时,公共数据与企业自有数据及商业数据互补融合,能够进一步提升数据完整性与价值密度,加速人工智能等数字技术在实体经济领域的渗透与创新[7]

(2)公共数据开放平台本身作为一项数字基础设施,具备较强的技术外溢性。开放平台在建设过程中积累的分布式存储、高性能计算、数据安全和隐私计算等共性技术能力,不仅会促进数字技术融合与迭代创新,也会通过技术服务商外溢至区域实体企业数字化平台建设,形成“数据开放→技术融合→场景创新”的正向循环[28]。政府部门基于数据开放平台主导或支持建设的智慧交通、智慧医疗等标杆性应用,也为区域内实体企业提供了具象化数实融合样板,有效缓解了其对数智化转型的认知障碍与技术采纳风险,加速成熟技术方案在产业链中的规模化应用[29]。因此,公共数据开放引致的数字技术创新及其在实体经济中的扩散应用,深化了数实融合边界与协同发展。

1.2.3 公共数据开放驱动数实融合的市场塑造机制

数据要素市场理论指出,数据非竞争性使其能够以较低边际成本进行共享和复用,并通过市场化流动实现接近最优的经济效率[30]。公共数据开放通过扩大数据要素供给、培育市场生态与催生融合业态,为数字技术赋能实体经济开拓高效的市场化配置渠道。

(1)在数据要素供给方面,政府及公共部门作为最大的公共数据持有者,其数据开放行为极大扩充了社会数据要素总量与类型,不仅有助于缓解市场数据稀缺性问题,还能通过构建数据共享示范、培育数据共享文化,为社会数据更广泛地参与市场交易奠定信任基础,从而盘活整个社会数据资源的流动潜能[11,31]

(2)在要素市场培育方面,公共数据开放下的授权运营和数据沙箱等市场化机制,为数据要素市场化定价、交易与收益分配等核心规则完善提供了宝贵经验[32]。同时,围绕公共数据开发与利用,催生出对数据清洗、分析和应用开发等专业技术服务的市场需求,吸引和培育多元化数据服务商与初创企业集聚,为繁荣数据要素市场提供了主体支撑[33]

(3)在促进业态融合方面,公共数据开放催生出大量面向智能制造、供应链金融和精准营销等场景的增值数据产品与决策支持服务。这些数据产品和服务不仅构成数实融合的重要组成部分,更为产业互联网和区域性服务平台提供了基础数据支撑,使其能够更为有效地连接和整合产业链资源,推动平台经济更好地服务实体经济发展[34]。数据要素市场机制为区域数实融合提供了更加高效的价值交换平台与资源配置平台,进而提升数实融合水平。

综上所述,公共数据开放形成的制度、技术与市场三重属性并非彼此孤立,而是一个相互依存、协同演进的有机整体。公共数据开放下的制度环境构建是基础,为数实融合技术赋能与市场塑造奠定规则保障与稳定预期;技术驱动是数实融合的直接引擎,为制度效能提升与要素市场价值创造提供基础支撑与直接动力;市场塑造机制是制度与技术价值得以最终实现的场域,同时推动制度环境与技术创新方向不断优化与调整。三者动态适配并呈螺旋式上升演进,共同促进公共数据资源高效汇聚和有序流通,削弱实体经济数字化转型中的制度障碍、技术瓶颈与数据流通壁垒,驱动区域数实融合向更深层次迈进。本文提出假设:

H1:公共数据开放能够促进区域数实融合水平提升。

H2:公共数据开放通过提升区域制度环境、数字技术创新和数据要素市场化水平促进区域数实融合。

2 研究设计

2.1 模型构建

已有关于公共数据开放政策效果评估的研究主要采用双重差分法进行分析,但双重差分法需要满足较为严格的前提条件,而且容易产生有偏估计。双重机器学习作为一种半参数因果推断方法,其利用机器学习算法处理非线性数据的优势,能够有效规避模型误设问题,克服非线性关系导致的估计偏误和多重共线性问题,且在包含双向固定效应控制变量的前提下,能够提供更为精确的因果效应估计结果[17,35]。鉴于此,为准确识别公共数据开放对区域数实融合的影响,本研究采用双重机器学习方法进行分析,具体模型设定如下:

Yit=θPDOit+f(Xit)+Uit

(1)

E(Uit|PDOit,Xit)=0

(2)

PDOit=g(Xit)+Vit

(3)

E(Vit|Xit)=0

(4)

其中,i为城市;t为年份;Yit为被解释变量,反映城市数实融合水平;PDOit为处理变量,表示城市公共数据开放政策。本文假设城市公共数据开放为1,否则为0;θ为处理变量的估计系数,用于评估公共数据开放政策是否促进数实融合;Xit为其它控制变量;f(Xit)、g(Xit)为需要通过机器学习算法进行估计的函数;UitVit为误差项,代表均值为0的随机扰动项。

2.2 变量设定

2.2.1 被解释变量:数实融合(DRI)

从经济运行角度看,数字经济与实体经济融合发展主要表现为微观层面企业数字技术应用以及中观层面数字产业与实体产业融合[15]。已有研究对数实融合水平的测度主要采用投入产出法与耦合协调模型进行测算。然而,投入产出法受编制数据限制,测算结果缺乏时效性,耦合协调模型只能粗略测算数字经济子系统和实体经济子系统之间的耦合协调关系,无法精准体现不同产业间融合水平。基于此,参考周密等[16]提出的专利共分类方法测算区域数实融合水平。具体步骤如下:首先,根据区域专利申请数据的国际专利分类号(IPC)信息,构建IPC共现矩阵。其次,利用国家知识产权局发布的《国际专利分类与国民经济行业分类参照关系表(2018)》,将IPC号映射至国民经济行业小类,形成产业共现矩阵,用以表示不同产业之间的融合水平。再次,将产业划分为数字经济产业与实体经济产业,通过矩阵分块提取数字产业与实体产业融合子矩阵。最后,根据共现频次计算数实融合整体水平,共现频次越高,表明产业融合程度越深。由于该方法计算的数实融合水平包括数字实体产业与传统实体产业融合水平(DRRI),以及数字虚拟产业与传统实体产业融合水平(DDRI),故本文采用二者均值衡量区域数实融合水平。其中,数字实体产业主要包括数字产品制造、数字产品服务、软件开发等产业,数字虚拟产业主要为互联网金融产业。

2.2.2 解释变量:公共数据开放(PDO)

以城市是否上线公共数据开放平台进行衡量,若该地区上线公共数据开放平台,则上线当年及以后年度赋值为1,否则赋值为0。根据复旦大学数字与移动治理实验室联合国家信息中心数字中国研究院发布的《2024 中国地方公共数据开放利用报告(城市)》,整理各城市公共数据开放平台上线时间。

2.2.3 中介变量

本文中介变量包括区域制度环境(INS)、数字技术创新水平(DTI)和数据要素市场化水平(DFU)。既有研究认为公共数据开放通过影响制度的规制、规范与认知,进而促进区域数实融合。基于此,本文从制度的三大支柱内涵出发,构建制度环境综合指数,具体计算过程如下:①采用每百人新注册企业数衡量区域规制环境[36],创业活动对制度环境高度敏感,新注册企业数量能直接反映正式法律制度环境下市场主体对制度性交易成本的认可度。②用数字化政府建设指数表征区域规范环境,数字化政府建设有助于提升政府透明度和执行效率,从而抑制市场寻租空间,促进规范合作与公平竞争。该指标参考刘文革等(2024)的做法,采用机器学习中的TF-IDF算法,计算样本城市政府工作报告文本中“数字化政府”相关词汇的词频—逆文本频率,并利用财政支出比率进行加权调整生成[37]。③用地方政府创新重视程度衡量区域认知环境,政府对创新的重视程度能够较好地反映其创新发展和多元共治理念的转变情况。该指标参考瞿茜等(2025)构建的创新相关关键词词典,运用机器学习算法,计算样本城市政府工作报告文本中创新相关词汇的词频—逆文本频率,用以刻画城市创新重视程度[38]。基于上述规制环境、规范环境和认知环境3项指标,运用熵权法构建区域制度环境综合指数。数字技术创新水平采用人均数字经济专利申请量的自然对数值衡量[39]。数据要素市场化水平用城市人均软件业务收入衡量[40]。软件产业是支撑区域数据资源向生产要素转化的核心载体,地区软件业务销售收入规模可表征当地信息服务体系成熟水平与数字生态完善程度。因此,软件业务销售收入在一定程度上能够反映区域在数据资源开发利用、数据资产培育以及数字基础设施建设等方面的综合能力,可衡量地区数据要素市场化水平(戴翔和成鹏东,2025)。由于国家统计局只公布了省级层面软件业务收入,未公布城市层面数据,而城市软件业务收入与其信息传输、计算机服务和软件业(以下简称“软件行业”)从业人员规模密切相关,因此本文基于Bartik工具变量法思路,利用城市软件行业从业人员规模数据,将省级软件业务收入分解至城市层面(余振等,2025)。以2008年为基准年份(我国于2008年开展第二次全国经济普查,以此为基准年份,以确保基期数据的准确性),采用基准年份各城市软件行业从业人员就业份额与省级层面软件业务收入生产率测算城市层面软件业务收入水平(CSW),进而计算人均软件业务收入,用以衡量城市数据要素市场化水平,计算公式如下:

(5)

其中,ijt分别表示城市、行业和年份,Labori,j,t=2008i城市软件行业2008年从业人员规模,Labori,t=2008i城市2008年全行业从业人员规模,SWj,t=2008表示i城市所在省份软件行业2008年业务收入,Laborj,t=2008i城市所在省份软件行业2008年从业人员规模。

2.2.4 控制变量

为避免重要变量遗漏对估计结果造成的不良影响,本文对相关变量进行控制[10-12],具体包括:①经济发展水平(PGDP):经济发展水平较高地区,其数字经济与实体经济发展水平也相对较高,有助于促进数实融合,本文用人均地区生产总值的自然对数衡量。②金融发展水平(FIN):金融发展水平越高,其对数字经济与实体经济的金融支持力度也就越大,用年末金融机构贷款余额与地区生产总值的比值衡量。③城镇化水平(URB):城镇化水平反映地区经济活动密度和基础设施建设水平,用城镇人口与常住人口的比值衡量。④产业结构(STR):产业结构升级有助于促进资源集聚和要素协同,深化产业分工和专业化协作,促进数据要素与传统要素融合发展,用第三产业产值占地区生产总值的比值衡量。⑤人力资本水平(HUM):高素质人才为区域数字经济与实体经济融合提供支撑,用普通高校在校学生数与地区总人口的比值衡量。⑥地区开放水平(FDI):国外资本进入有利于引进先进技术和管理经验,开拓国际市场渠道,促进技术溢出与产业升级,推动数字经济与实体经济融合,用当年实际使用外资与地区生产总值的比值衡量。⑦政府干预程度(GOV):财政支出通过数字基建投入、企业改造升级、核心技术研发支持等方式撬动社会资本,优化资源配置,加速数实深度融合进程,用财政支出占地区生产总值的比值衡量。⑧教育支出水平(EDU):教育支出通过培养技术人才、支持高校科技创新与产研融合,为数实融合提供人才支撑与智力支持,用教育支出占地区生产总值的比值衡量。⑨数字基础设施建设水平(DIF):数字基础设施为数实融合提供网络和算力等基础支撑,促进数据流通与技术落地,用每百人移动电话用户数、每百人互联网宽带接入数和人均电信业务量等指标衡量,并用熵权法计算城市数字基础设施水平[41]。⑩传统基础设施水平(TIF):传统基础设施是实体要素流动的通路,为数据流与物流协同提供物理基础,支撑产业链数字化改造与区域数字经济发展,用货运总量的自然对数值表示。变量测度见表1。

表1 变量定义与测度
Table 1 Variable definitions and measurement

变量类型 变量名称 变量符号 测度方法被解释变量数实融合DRI利用专利共分类方法计算数实融合水平解释变量公共数据开放PDO城市上线公共数据开放平台的当年及以后年度为1,否则0中介变量区域制度环境INS选取每百人新注册企业数、数字化政府建设指数和地方政府创新重视程度指标,运用熵权法生成制度环境综合指数数字技术创新水平DTI人均数字经济专利申请量的自然对数数据要素市场化水平DFU人均软件业务收入控制变量经济发展水平PGDP人均地区生产总值的自然对数值金融发展水平FIN年末金融机构贷款余额与地区生产总值的比值城镇化水平URB城镇人口与常住人口的比值产业结构STR第三产业产值占地区生产总值的比值人力资本水平HUM普通高校在校学生数与地区总人口的比值地区开放水平FDI当年实际使用外资与地区生产总值的比值政府干预程度GOV财政支出占地区生产总值的比值教育支出水平EDU教育支出占地区生产总值的比值数字基础设施建设水平DIF采用每百人移动电话用户数、每百人互联网宽带接入数和人均电信业务量指标,运用熵权法计算城市数字基础设施水平传统基础设施水平TIF货运总量的自然对数值

2.3 数据来源

本文以2010—2023年我国285个地级市为研究样本,数实融合专利数据来源于专利申请数据库,包括发明专利和实用新型专利;公共数据开放处理变量根据《2024中国地方公共数据开放利用报告—城市》整理;城市新注册企业数量数据来源于企查查工商注册数据库,根据企业注册时间和所在城市等信息,将其整合为城市—年份层面数据;数字政府和城市创新重视程度指标,采用《政府工作报告》文本,运用大数据文本分析法构建;数字经济专利申请量数据来源于CNRDS数据库;其余控制变量数据来源于《中国城市统计年鉴》和国家统计局数据库,缺失数据通过插值法或均值法补齐。如表2所示,样本期内城市数实融合(DRI)水平均值为3.136 4,标准差为7.423 5,表明样本城市之间的数实融合水平差距较大,且呈明显的右偏分布。公共数据开放(PDO)的均值为0.207 1,表明有20.71%的城市样本上线了公共数据开放平台。中介变量方面,区域制度环境(INS)的均值为0.707,标准差为0.242 2,表明制度环境的离散程度相对较低;数字技术创新(DTI)的均值为-4.071 2,而标准差为3.492 3,说明样本城市数字技术创新水平整体偏低,且呈明显的左偏分布;数据要素市场化水平(DFU)的均值为0.009,标准差为0.027 5,样本右偏分布明显,且样本之间水平差异较大。其余控制变量指标水平与相关研究基本一致。

表2 变量描述性统计结果
Table 2 Main variable descriptive statistics

变量 观测数均值标准差最小值最大值DRI3 9893.136 47.423 5 0.001 1 45.638 2PDO3 9890.207 10.405 30.000 01.000 0INS3 9890.707 00.242 2-2.430 96.053 7DTI3 989-4.071 23.492 3-15.096 46.189 7DFU3 9890.009 00.027 50.000 01.031 5PGDP3 98910.763 80.595 68.576 212.486 4FIN3 9891.087 50.681 30.132 212.817 1URB3 9890.453 90.199 8-3.942 41.122 0STR3 98942.873 910.221 39.760 084.850 0HUM3 9894.747 60.955 4-0.610 27.224 8FDI3 9891.312 72.323 90.000 030.520 2GOV3 9890.202 60.103 00.043 90.915 5EDU3 9893.480 01.826 00.213 518.547 4DIF3 9890.728 80.171 50.306 42.178 7TIF3 9899.138 01.201 94.644 413.225 8

3 实证结果与分析

3.1 公共数据开放数实融合驱动效应

本文使用双重机器学习模型估计公共数据开放对数实融合的影响,其中样本分割比例设为1∶4,采用随机森林算法对主回归和辅助回归进行预测求解,结果如表3所示。列(1)对全样本控制变量一次项、城市固定效应和时间固定效应进行控制,结果显示公共数据开放对数实融合的影响系数为正,且在1%水平上显著,说明公共数据开放促进区域数实融合。列(2)进一步对控制变量的二次项进行控制,影响系数依然显著为正,表明公共数据开放能够显著促进区域数实融合,假设H1得到验证。

表3 基准回归结果
Table 3 Baseline regression results

变量DRIDRIDRRIDDRI(1) (2) (3) (4) PDO0.779 1∗∗∗0.837 8∗∗∗1.048 1∗∗∗0.796 9∗∗∗(0.184 9)(0.189 9)(0.236 7)(0.207 5)控制变量一次项是是是是控制变量二次项否是是是城市固定效应是是是是时间固定效应是是是是样本量3 989 3 989 3 989 3 989

注: ***、**、*分别表示1%、5%、10%水平上显著,括号数值为稳健标准误,下同

本文进一步分析公共数据开放对数字实体产业与传统实体产业融合(DRRI)以及数字虚拟产业与传统实体产业融合(DDRI)的影响,结果分别如列(3)和列(4)所示。可见,公共数据开放能显著促进二者融合,且对数字实体产业与传统实体产业之间的融合影响作用更显著。可能原因在于,数字实体产业与传统实体产业融合,如智慧农业、智能制造和智能物流等融合形态,体现为直接的数字技术赋能与资源配置效率提升,数字设备或数字技术应用深度融合至传统产业研发、生产与管理等各个环节,因而公共数据开放通过制度、技术和市场的多重效应对数实融合产生多方面影响。相比之下,数字虚拟产业与传统实体产业融合主要表现为供应链金融等以资金配置优化为核心的赋能模式,公共数据开放的驱动效应更多体现为数据信息供给与风险定价优化,其对实体产业内部技术变革与组织重构的影响作用有限,整体驱动效应也会弱于前者。

3.2 稳健性检验

3.2.1 调整研究样本

中国省市间数字基础设施和经济发展水平空间差距较大,且公共数据开放深度与广度存在较大差异,基于全部地级市样本的分析可能导致估计偏误。为此,剔除西藏、青海、宁夏、新疆、云南和贵州等西部省份城市重新进行检验。回归结果如表4所示,列(1)显示公共数据开放对数实融合的影响系数显著为正,表明基准回归结果具有稳健性。

表4 稳健性检验结果
Table 4 Robustness test results

变量调整样本上下1%缩尾上下5%缩尾省份-时间固定效应(1)(2) (3) (4) PDO0.828 7∗∗∗0.685 0∗∗∗0.461 6∗∗∗0.918 6∗∗∗(0.206 3)(0.184 1) (0.114 3)(0.235 3)控制变量一次项是是是是控制变量二次项是是是是城市固定效应是是是是时间固定效应是是是是样本量3 6673 989 3 989 3 989

3.2.2 剔除异常值影响

为避免样本异常值可能对基准回归结果的影响,对被解释变量和控制变量分别进行上下1%和5%的缩尾处理,检验结果分别如表4列(2)(3)所示。结果显示,在对样本进行缩尾处理后,公共数据开放对数实融合的影响系数依然显著为正。可见,在剔除样本异常值后,研究结论保持一致。

3.2.3 增加省份和时间交互固定效应

由于同一省份城市在响应政策和应对差异化冲击等方面具有相似性,为避免遗漏变量干扰,本文在基准回归结果的基础上,加入省份和时间交互固定效应,结果如表4列(4)所示。结果显示,在考虑同一省份不同城市间关联影响后,公共数据开放对数实融合的正向影响依然成立。

3.2.4 重设双重机器学习模型

为避免双重机器学习模型设定偏误对研究结论的影响,通过重设机器学习模型进行稳健性检验。一是改变模型样本分割比例,由之前的1∶4调整为1∶2和1∶6,验证不同样本分割比例对研究结论的影响。二是更换机器学习算法,将基准回归中的随机森林算法更换为套索回归和神经网络算法,从而验证预测算法变化是否会对研究结论产生影响。最后,为缓解模型设定偏误对推断结果的潜在干扰,进一步采用更为一般的交互式双重机器学习模型进行分析。模型构建如下:

Yit=f(PDOit,Xit)+Uit

(6)

PDOit=g(Xit)+Vit

(7)

重设双重机器学习模型估计结果如表5所示,可见,无论是调整样本分割比例,还是重设机器学习算法或模型设定形式,公共数据开放均能促进区域数实融合,说明基准回归结论具有稳健性。

表5 重设双重机器学习模型检验结果
Table 5 Test results of reconfigured double machine learning models

变量1∶2交叉检验1∶6交叉检验套索回归神经网络交互模型(1)(2) (3) (4) (5) PDO0.748 6∗∗∗0.767 7∗∗∗2.057 6∗∗∗1.152 7∗∗∗1.895 5∗∗∗(0.182 1)(0.184 4)(0.343 9)(0.217 8)(0.217 8)控制变量一次项是是是是是控制变量二次项是是是是是城市固定效应是是是是是时间固定效应是是是是是样本量3 9893 989 3 989 3 989 3 989

3.2.5 剔除并行政策影响

研究表明,“宽带中国”、国家大数据综合试验区和智慧城市政策有助于促进大数据和人工智能等数字技术应用,推动区域数实融合发展[12]。因此,为确保公共数据开放对数实融合影响效应的准确性,本文对同时期“宽带中国”、国家大数据综合试验区和智慧城市政策分别进行控制,结果如表6列(1)~(3)所示。可见,在剔除同期并行政策影响后,公共数据开放系数依然显著为正。

表6 剔除并行政策与工具变量回归结果
Table 6 Results of IV regression excluding concurrent policies

变量“宽带中国” 大数据试点智慧城市工具变量(1) (2) (3)(4)PDO0.690 9∗∗∗ 0.822 1∗∗∗0.710 1∗∗∗2.522 1∗∗∗(0.183 9)(0.193 9) (0.182 4) (1.238 7)宽带中国是 否否否大数据试点否 是否否智慧城市否 否是否控制变量一次项是 是是是控制变量二次项是 是是是城市固定效应是 是是是时间固定效应是 是是是样本量3 989 3 989 3 989 3 989

3.2.6 工具变量回归

城市经济和数字化发展水平可能会对公共数据开放平台上线产生影响,而地区数字经济与实体经济融合发展又会进一步促进城市数字化转型进程,因而为避免存在逆向因果与遗漏变量而产生的内生性问题,本文采取工具变量法缓解相关因素的内生性影响。在工具变量选取上,参考柏培文和张云[42]的研究,采用城市地形起伏度乘以上一期全国互联网宽带接入端口数的对数值,构建二者交互项面板数据,作为公共数据开放政策的工具变量(IV)。其合理性在于:一方面,尽管地形起伏度是脱离经济系统的外生变量,但平坦的地形条件有助于促进城市经济发展和网络基础设施建设,从而影响该城市公共数据开放进程,故满足相关性假设。另一方面,地形起伏度对当期数实融合水平无直接影响,且上一期全国互联网宽带接入端口数也不会对地区数实融合水平产生直接影响,从而满足外生性假设。在此基础上,构建双重机器学习部分线性工具变量模型,具体如下:

Yit=θPDOit+f(Xit)+Uit

(8)

IVit=g(Xit)+Vit

(9)

工具变量回归结果如表6列(4)所示,可见在加入工具变量后,公共数据开放影响系数依然在1%水平上显著为正,表明公共数据开放促进区域数实融合的结论具有稳健性。

3.3 中介机制检验

本文采用江艇[43]的机制检验思路,验证区域制度环境、数字技术创新和数据要素市场化水平3条路径的中介效应,结果如表7所示。公共数据开放对制度环境(INS)、数字技术创新(DTI)和数据要素市场化水平(DFU)的影响系数分别为0.045 7、0.055 8和0.163 1,且所有系数均通过至少10%显著性水平检验,表明公共数据开放能显著改善区域制度环境、提升数字技术创新和数据要素市场化水平,进而促进区域数实融合,假设H2得到验证。

表7 机制分析结果
Table 7 Mechanism analysis results

变量 INSDTIDFU(1)(2) (3)PDO0.045 7∗0.055 8∗∗0.163 1∗∗∗(0.163 1)(0.019 4) (0.025 2)控制变量一次项是是是控制变量二次项是是是城市固定效应是是是时间固定效应是是是样本量3 9893 989 3 989

进一步比较三者影响系数发现,数据要素市场化水平影响系数最大,其次为数字技术创新,而制度环境影响系数最小,表明在当前公共数据开放驱动数实融合的3种影响机制中,数据要素市场塑造机制影响效应最大,其次为技术赋能机制,而制度环境构建机制的影响效应最小。可能原因在于,3条中介机制的作用路径与时效性不同。其中,数据要素市场化塑造机制影响作用最直接,其通过扩大数据供给、降低市场获取与利用成本以及促进数据要素交易流通产生立竿见影的经济效益和融合效果,一旦数据通过市场进行高效配置,便能直接快速地与企业需求匹配,故其作用效果最显著。数字技术创新的影响效应居中,主要在于公共数据开放虽直接驱动技术进步及其在实体场景中的应用,但其价值实现需经过技术研发与场景适配过程,存在一定研发周期和转化门槛,故其影响效应滞后于直接市场交易。制度环境影响效应最弱,其作用效应释放更多体现在降低社会整体成本以及塑造市场预期与文化认知等方面,具有基础性和长期性特点,因而短期内影响效应不明显。

4 进一步分析

4.1 异质性分析

本文主要从公共数据开放水平和城市活力两个方面对城市层面特征影响差异进行分析。一方面,公共数据开放形成的制度构建、技术赋能与市场塑造机制有助于促进区域数实融合水平提升。因而,高水平公共数据开放有助于推动公共数据开放规则体系和治理效能建设,强化公共数据开放的技术属性和市场属性,从而更好地发挥数实融合驱动效应。另一方面,高活力城市通常在人口、资本、技术和基础设施等方面更具优势,能为数实融合提供更为适宜的技术环境和融合应用场景。因此,在不同城市活力环境下,公共数据开放对数实融合的驱动作用有所不同。

为验证城市公共数据开放水平的异质性影响,本文基于复旦大学数字与移动治理实验室联合国家信息中心数字中国研究院发布的地方政府公共数据开放数林指数,根据《2021年度中国地方政府数据开放报告(城市)》数据,将城市公共数据开放水平划分为综合排名前50强和非前50强两组进行回归分析。开放数林指数从准备度、服务层、数据层和利用层4个维度构建评价指标体系,覆盖公共数据开放与利用的全链条,能够较好地评估地方政府公共数据开放水平,结果如表8列(1)(2)所示。可见,在公共数据开放前50强城市样本中,公共数据开放影响系数为4.374 1,且在1%水平上通过显著性检验,而在非50强城市样本中,公共数据开放系数尽管为正,但未通过显著性检验。这表明,城市公共数据开放水平对区域数实融合的影响效应存在异质性。

表8 异质性分析结果
Table 8 Heterogeneity analysis results

变量前50强非前50强高活力城市中活力城市低活力城市(1)(2) (3) (4) (5) PDO4.374 1∗∗∗0.184 14.326 8∗∗∗0.281 20.343 9∗∗∗(1.013 3)(0.140 8) (1.392 6)(0.238 0)(0.056 7)控制变量一次项是是是是是控制变量二次项是是是是是城市固定效应是是是是是时间固定效应是是是是是样本量7003 289 644 979 2 366

为验证城市活力对公共数据开放驱动数实融合的异质性影响,根据2021 年第一财经新一线城市研究所发布的《2021城市商业魅力排行榜》,将一二线城市划分为高活力城市、三线城市划分为中等活力城市、四五线城市划分为低活力城市,再分别进行分组回归分析。该评价体系从商业资源、城市枢纽、城市人活跃度、生活方式多样性和未来可塑性五大维度,系统评估城市商业魅力,指标涵盖城市经济、交通、消费、创新与人才等核心要素,既反映城市当下的发展动能,也兼顾长期发展潜力,因而能够较好地衡量城市活力,结果如表8列(3)~(5)所示。高活力城市和低活力城市公共数据开放均能显著促进数实融合,而在中等活力城市,这种促进效应不显著。造成这种差异的原因可能在于,城市活力具有双重门槛效应。当城市发展活力较低时,公共数据开放产生的制度、技术与市场边际效应较高,能够显著提升城市治理效能、技术水平,改善市场环境,促进数实融合发展;当城市活力达到一定程度时,这种边际效应不再显著,数实融合主要受当地其它经济和技术因素的影响;当城市活力发展到更高水平时,城市设施、商业和创新环境较为完善,公共数据开放价值被较好地挖掘和利用,数实融合驱动效应再次显著。因此,尽管高活力和低活力城市组公共数据开放均能促进数实融合,但其内在驱动机理存在差异。比较两组公共数据开放系数发现,列(3)系数值明显高于列(5),支持本文研究结论。

4.2 空间效应分析

技术与数据要素具有非竞争性,因而公共数据开放所形成的数据要素供给与技术能力能够突破行政边界限制,形成空间溢出效应。一方面,任何组织或个人都可以通过互联网公开途径或授权方式直接获取异地开放的公共数据资源,提升决策与服务效能,形成知识溢出。另一方面,支撑公共数据开放的应用技术和服务能力也会通过供应商实现技术共享与应用示范效应,降低周边地区接入与应用门槛,加速技术溢出。这种要素与技术跨域流动不仅会优化资源配置,更能驱动跨区域创新网络形成与协同发展,进而对城市数实融合产生影响。基于此,参考已有研究,本文构建省内中心城市与外围城市(剔除4个直辖市样本数据)以及邻近城市之间的数实融合指标[17]。具体而言,以对应地区集合中的数实融合指标最大值为分子,以本城市数实融合指标为分母,衡量数实融合水平相对差距。该指标值越小,说明地区之间的数实融合水平差距越小。邻近城市集合采用地理邻接矩阵构建。由于我国东西部城市之间,尤其是位于“胡焕庸线”两侧城市整体发展水平差距较大,因此本文进一步根据“胡焕庸线”将其划分为东、西侧两组。

空间效应检验结果如表9所示。列(1)汇报了公共数据开放对省内中心城市与外围城市数实融合相对差距的影响,影响系数为-0.122 1,在1%水平上显著为负,表明公共数据开放有助于缩小省内中心城市与外围城市数实融合差距。可能原因在于,同一省份内城市在政策响应和制度、文化等方面具有相似性,且省内要素流动壁垒较低,中心城市公共数据开放外溢效应更显著,从而促进省内整体数实融合水平提升,缩小了中心城市与外围城市之间的差距。

表9 空间效应检验结果
Table 9 Spatial effects test results

变量省内中心与外围“胡焕庸线”东“胡焕庸线”西(1)(2) (3)PDO-0.122 1∗∗∗1.307 7∗-0.726 5(0.045 1)(0.730 3) (1.564 3)控制变量一次项是是是控制变量二次项是是是城市固定效应是是是时间固定效应是是是样本量3 9333 066 798

列(2)(3)汇报了公共数据开放对位于“胡焕庸线”两侧邻近城市之间数实融合相对差距的异质性影响。其中,位于“胡焕庸线”东侧城市的影响系数在10%水平上显著为正,而位于“胡焕庸线”西侧城市的影响系数为负,但没有通过显著性检验。这表明,位于“胡焕庸线”东侧城市公共数据开放会扩大与其邻近城市之间的数实融合差距,即存在虹吸效应;而位于“胡焕庸线”西侧城市公共数据开放则与邻近城市无显著差距。这种异质性空间效应可能是由于东侧城市经济更发达、数字基础设施建设更完善、人才更密集,公共数据开放能吸引更多高质量资本、人才、创新企业向其聚集,强化其区域核心地位,从而对邻近城市产生虹吸效应,并进一步扩大数实融合差距。而西侧城市由于经济发展水平和数字设施等基础条件较弱,公共数据开放形成的要素供给和技术服务既缺乏足够吸引力引发虹吸效应,也因周边城市承接能力有限,难以有效扩散并被邻近城市吸收和利用,故其空间效应不显著。

5 结语

5.1 研究结论

深化公共数据开放是释放数据要素价值的重要战略举措,对促进区域数字经济与实体经济融合发展具有重要意义。本文构建公共数据开放的“制度—技术—市场”整合分析框架,基于2010—2023年中国内地285个地级市面板数据,运用专利共分类法与双重机器学习模型,实证检验公共数据开放对区域数实融合的驱动效应。研究发现:第一,公共数据开放能显著促进区域数实融合水平提升,该结论在经过样本调整、模型重构和工具变量控制等一系列稳健性检验后依然成立。机制检验表明,公共数据开放主要通过改善区域制度环境、提升数字技术创新水平及数据要素市场化程度等途径发挥数实融合驱动作用。第二,公共数据开放对数实融合的驱动效应存在显著异质性,公共数据开放质量较高城市的驱动效应显著,而数据开放质量较低城市影响效应不显著;在城市活力维度上,高活力与低活力城市的驱动效应显著,而中等活力城市的驱动效应未通过显著性检验。第三,公共数据开放对数实融合的影响具有空间溢出效应,在同一省级行政区内,公共数据开放有助于缩小中心城市与外围城市之间的数实融合水平差距;在邻近城市层面,位于“胡焕庸线”东侧的中心城市公共数据开放对外围城市数实融合呈现出显著虹吸影响,而在“胡焕庸线”西侧,这种溢出效应不显著。

5.2 政策启示

(1)公共数据开放对区域制度环境的构建是驱动数实融合的重要途径。政府部门可借鉴先行城市的成功经验,不断完善数据分级分类标准、开放清单制度和授权运营模式等实施细则,建立清晰、有效的公共数据开放规则体系,降低企业数据利用合规成本。在规范性制度构建方面,通过推进公共数据开放与数字政府建设,提升政务服务效能与政府治理透明度,从而降低企业在行政审批等方面的制度性交易成本,抑制市场寻租空间,增强企业等市场主体对公平竞争的预期,开展长期数字化投资意愿。此外,塑造创新文化,通过开展创新创业大赛、开放数据利用大赛等方式,鼓励企业、研究机构和社会公众等主体参与公共数据价值开发与创新应用,营造公共数据共治共享的文化氛围。

(2)通过建设高质量公共数据集和高标准数据开放平台,增强开放平台的技术溢出效应,发挥公共数据开放的技术赋能作用。具体而言,在增强公共数据可得性和利用价值方面,严格规范数据清洗和标注要求,完善数据管理维护机制;同时,积极推进人工智能、区块链和隐私计算等前沿技术应用,提升公共数据开放平台服务能力,尽可能降低市场主体获取和利用公共数据的技术门槛和应用成本。此外,立足本地产业特色,引导区域龙头企业和研究机构在智能制造、智能物流、供应链金融等重点领域打造一批数实融合的标杆性、示范性应用场景,增强区域内企业对新技术应用的认知,降低其对转型风险的担忧,促进成熟技术解决方案在工业企业的推广和应用。

(3)数据要素市场化是发挥公共数据开放数实融合驱动效应的重要路径。政府部门针对性地在数据要素市场塑造方面精准发力,积极探索公共数据授权运营模式,大力培育数据交易机构和数据信托等多元市场运营主体。根据地方经济发展实际,积极引进和培育数据清洗、标注和分析等专业数据服务商,发展具有地方特色的数据服务产业,丰富数据产品与服务形式,提升数据要素市场化能力。实施“数据要素×”行动计划,推动公共数据与行业数据和社会数据融合,支持工业互联网平台整合公共数据资源,发展供应链金融等融合型业态,引导平台企业利用公共数据优化服务、赋能实体,构建健康可持续的区域平台经济生态。

(4)公共数据开放数实融合驱动效应不仅呈现出典型的异质性,而且还存在复杂的空间溢出效应。地方政府在政策制定上应根据城市禀赋实际,实施差异化开放策略。对于高活力一二线城市,应对标国内外先进地区,持续完善公共数据开放制度环境,推进数据要素市场化改革,强化数据开放与产业创新联动,打造具有全球影响力的数实融合先导区。对于中等活力的三线城市,重在提升其数据开放质量和技术应用承接能力,补齐数字基础设施短板,提升其数实融合效应。对于低活力的四五线城市,应结合本地产业禀赋,挖掘特色公共数据,赋能实体经济融合发展。在空间溢出与区域协同方面,对位于“胡焕庸线”东侧的城市,可通过跨区域数据联盟、飞地经济等措施,弱化中心城市的虹吸效应,而在“胡焕庸线”西侧地区,则应强化省内技术帮扶与基础设施共建,提升数据承接与转化能力,促进区域数实融合。

5.3 不足与展望

本文不足之处在于:第一,以城市是否上线公共数据开放平台二元虚拟变量衡量公共数据开放,未能充分捕捉城市公共数据开放质量差异。未来可通过构建多维度、连续型公共数据开放质量指数,细化公共数据开放政策对数实融合的差异化影响。第二,对省内及邻近城市间的空间效应采用相对差距指标进行分析,忽视了城市间经济距离和技术关联网络等更为复杂的空间依赖结构的影响。未来可基于企业投资和专利合作等数据,构建城市间经济与创新网络,进一步拓展空间效应分析视角。

参考文献:

[1] 欧阳日辉.数据要素促进数字经济和实体经济深度融合的理论逻辑与分析框架[J].经济纵横,2024,39(2):67-78.

[2] 洪银兴,任保平.数字经济与实体经济深度融合的内涵和途径[J].中国工业经济,2023,40(2):5-16.

[3] ZUIDERWIJK A,JANSSEN M,DAVIS C. Innovation with open data: essential elements of open data ecosystems[J].Information Polity, 2014,19(1):17-33.

[4] LNENICKA M, MACHOVA R, VOLEJNIKOVA J, et al. Enhancing transparency through open government data: the case of data portals and their features and capabilities [J]. Online Information Review, 2021, 45(6): 1021-1038.

[5] 蓝发钦, 胡晓敏, 徐卓琳. 公共数据开放能否拓展资本跨区域流动距离——基于异地并购视角[J]. 中国工业经济, 2024, 40(9): 156-174.

[6] MOGHADASI A. Do SMEs consider open data as a vital intellectual asset? a systematic literature review[J]. Journal of the Knowledge Economy, 2023, 15(3): 11784-11818.

[7] 沈坤荣,林剑威.链“岛”成“陆”:公共数据开放的技术创新效应研究[J].管理世界,2025,41(2):83-104.

[8] 卜伟,张应允.公共数据开放对新质生产力的赋能效应——基于社会再生产视角[J].科技进步与对策,2025,42(20):129-141.

[9] ZHAO W, SUN Q. Public data openness and firm innovation strategies[EB/OL].[2024-09-11].https://doi.org/10.1080/13504851.2024.2401508.

[10] 张晖,李靖,权天舒.数字基础设施建设促进了数字经济与实体经济融合吗——基于“宽带中国”战略的准自然实验[J].经济问题探索,2023,43(10):1-15.

[11] 王晓丹,石玉堂,刘达.公共数据开放能促进数字经济与实体经济融合吗——来自政府数据平台上线的准自然实验[J].南方经济,2024,41(9):25-44.

[12] 谢思,房克雷,和军.智慧城市建设能否促进数实融合——基于双重机器学习的因果推断[J].产业经济研究,2024,22(4):100-113.

[13] 王志刚,项猛.数实融合的路径分析:基于大数据综合试验区的准自然实验[J].经济问题探索,2024,44(9):95-112.

[14] SUN G, FANG J, LI J, et al. Research on the impact of the integration of digital economy and real economy on enterprise green innovation[J]. Technological Forecasting and Social Change, 2024, 200: 123097.

[15] 陈雨露.数字经济与实体经济融合发展的理论探索[J].经济研究,2023,58(9):22-30.

[16] 周密,王雷,郭佳宏.新质生产力背景下数实融合的测算与时空比较——基于专利共分类方法的研究[J].数量经济技术经济研究,2024,41(7):5-27.

[17] 张涛,李均超.网络基础设施、包容性绿色增长与地区差距——基于双重机器学习的因果推断[J].数量经济技术经济研究,2023,40(4):113-135.

[18] 段盛华,于凤霞,关乐宁.数据时代的政府治理创新——基于数据开放共享的视角[J].电子政务,2020,16(9):74-83.

[19] 姚凯,李晓琳. 基于制度理论的创业企业社会创新实现路径[J].管理科学,2022,35(3):58-72.

[20] 李爱君.数据要素市场培育法律制度构建[J].法学杂志,2021,42(9):17-28.

[21] ZHANG L,ZHANG X.Impact of digital government construction on the intelligent transformation of enterprises:evidence from China [J]. Technological Forecasting and Social Change, 2025, 210: 123787.

[22] DU J, GAO H, WEN H, et al. Public data access and stock price synchronicity: evidence from China [J]. Economic Modelling, 2024, 130: 106591.

[23] PARK S, GIL-GARCIA J R. Open data innovation: visualizations and process redesign as a way to bridge the transparency-accountability gap[J]. Government Information Quarterly, 2022, 39(1): 101456.

[24] 张云昊,王磊.公共数据开放伦理:概念界定、内在困境与治理路径[J].科技进步与对策,2025,42(5):12-20.

[25] AL-SAMALEK A S, AL-JAWAHRY H M, KUMAR R, et al. The role of information technology in enhancing organizational efficiency and innovation[C]. 2024 International Conference on Information Science and Communications Technologies (ICISCT), 2024.

[26] YU L, SUN Y. The application framework of artificial intelligence in the field of open data [J]. Economics &Business Management, 2025, 2(1): 21-28.

[27] 郑志强,何佳俐.唤醒“沉睡”的数据:公共数据开放与新企业进入[J].外国经济与管理,2025,47(4):82-97.

[28] 上官莉娜,王舒宁.数据要素赋能公共价值创造:超大城市数字公共基础设施建设的逻辑理路[J].城市发展研究,2025,32(6):85-91.

[29] CHEN K, ZHANG S. How does open public data impact enterprise digital transformation[J]. Economic Analysis and Policy, 2024, 83: 178-190.

[30] JONES C I, TONETTI C. Nonrivalry and the economics of data[J]. The American Economic Review, 2020, 110(9):2819-2858.

[31] 陈艳利,蒋琪.数据生产要素视角下开放公共数据与企业创新——基于建立公共数据开放平台的准自然实验[J].经济管理,2024,46(1):25-46.

[32] 张会平,顾勤,徐忠波.政府数据授权运营的实现机制与内在机理研究——以成都市为例[J].电子政务,2021,17(5):34-44.

[33] 欧阳日辉,李晓壮.社会资本参与公共数据开发利用的理论逻辑与福利效应[J].证券市场导报,2025,34(6):14-24.

[34] 蒋国银,庞正恒.公共数据开放何以促进平台经济规范健康持续发展——基于公共数据开放的准自然实验[J].统计研究,2025,42(6):51-65.

[35] CHERNOZHUKOV V, CHETVERIKOV D, DEMIRER M, et al. Double/debiased machine learning for treatment and structural parameters[J]. Econometrics Journal,2018,21(1):1-68.

[36] STENHOLM P,ACS Z J,WUEBKER R.Exploring country-level institutional arrangements on the rate and type of entrepreneurial activity[J]. Journal of Business Venturing, 2013, 28(1): 176-193.

[37] 刘文革, 耿景珠, 杜明威. 数“政”强贸:数字化政府建设与中国出口产品质量升级[J]. 数量经济技术经济研究, 2024, 41 (6): 67-87.

[38] 瞿茜, 郭俊聪, 王越. 区域经济增长的竞争与协同——基于对经济增长率的分解[J]. 南开经济研究, 2024, 40(3): 141-160.

[39] 蔡子阳,任燕燕,王文悦.社会信用体系建设能否提升地区数字技术创新水平——来自中国社会信用体系示范区的准自然实验[J].现代财经(天津财经大学学报),2024,44(12):3-18.

[40] 张辽,胡忠博.数据要素化对共同富裕程度的影响研究[J].软科学,2024,38(11):18-25,33.

[41] 张辉,王庭锡,孙咏.数字基础设施与制造业企业技术创新——基于企业生命周期的视角[J].上海经济研究,2022,41(8):79-93.

[42] 柏培文,张云.数字经济、人口红利下降与中低技能劳动者权益[J].经济研究,2021,56(5):91-108.

[43] 江艇.因果推断经验研究中的中介效应与调节效应[J].中国工业经济,2022,38(5):100-120.

(责任编辑:王敬敏)