In terms of empirical design, the paper constructs a dataset of 900 open source projects from the GitHub platform using a multi-dimensional stratified random sampling approach. The sample covers a variety of programming languages, creation years, and levels of development activity to ensure representativeness and diversity. Data collected via GitHub’s API and repository metadata include license types, code evolution trajectories, and community interaction features. Innovation performance is measured through a composite index based on seven key indicators and which is reduced using principal component analysis (PCA). The empirical analysis proceeds in three stages. First, multiple linear regression is employed to test the main effects of license complexity, infectivity, and compatibility on innovation performance, clarifying their structural impact mechanisms. Second, a mediation model is constructed by introducing license enforcement deviation as an intermediary variable to assess the indirect effects of institutional rules via behavioral pathways. The significance and robustness of the mediating effects are tested using the Sobel test and Bootstrap resampling methods. Third, robustness checks are conducted through variable refinement (subdividing infectivity levels), sample adjustment (excluding newly created or inactive projects), the inclusion of additional control variables (institutional affiliation of the project), and instrumental variable estimation using two-stage least squares (2SLS), providing a comprehensive evaluation of the empirical findings.
The results show that license structure significantly influences project innovation performance. Specifically, higher levels of complexity and infectivity are associated with more pronounced negative effects, while greater compatibility facilitates collaboration and knowledge integration, thus improving innovation outcomes. The mediating role of behavioral mechanisms is also confirmed, indicating that institutional rules shape project performance indirectly through their influence on contributor behavior. Further analysis reveals heterogeneous effects across different project types: software development projects are more sensitive to institutional structure, whereas AI and data science projects exhibit relatively weaker responses to license rules.
This paper contributes to the open source governance literature by shifting the analytical focus from static legal classification to the structural logic of institutional rules, and by extending the “institution-behavior-performance” paradigm. It highlights the deep interdependence between rule design and behavioral responses. Theoretically, it reveals how structural governance tools affect innovation in open collaboration environments; practically, it proposes policy implications for optimizing license design, implementing stratified governance strategies and strengthening behavioral regulation. Future research may further expand data sources and analytical dimensions by incorporating multi-platform dynamic data, longitudinal tracking, and variables related to informal governance mechanisms. This would help deepen understanding of the interaction among institutional evolution, behavioral adaptation, and collaborative innovation, and contribute to building a more dynamic and pluralistic framework for open source IP governance.
数字经济时代,开源社区作为一种致力于软件开发和代码共享的数字化协作平台[1],以特定许可证约束下代码众包的形式促进不同产业领域和不同技术之间合作[2],成为推动创新高质量发展、加快形成新质生产力的关键引擎[3]。开源社区是互联网发展众多开放式创新社区中的具体体现,是由拥有共同兴趣爱好的软件开发人员或有开发需求的企业协同开发的网络空间[4]。开源项目作为开源社区的核心要素,其创新绩效影响开源社区活跃度、参与度以及长期可持续发展能力[5]。当前,一些学者围绕项目参与者角色特征、项目评价及项目行为模式与开源社区创新绩效展开研究。沈占波等[5]通过fsQCA组态分析,探究开放式创新社区中用户知识共享水平路径和影响因素;王玲等[6]从项目发起人行为出发,研究个体参与动机、价值观、影响力和创新意识对项目创新绩效的影响,并提出对项目发起人行为进行引导的建议;陈晓红等(2016)基于项目成员个体特征,探讨参与动机、社会网络和组织文化等对开源项目创新绩效的影响,认为开源项目团队管理能力比技术能力更重要;李英姿等[7]根据认知评价理论,研究项目在线评价数量和评价正负性对创新绩效的影响,并根据参与者类型不同,探讨在线评价的影响差异;代君等[8]根据开源社区中项目提交行为特征,发现不同提交行为特征,如代码提交频率、文件修改次数等对项目创新绩效的影响效果不同;Tang等[9]分析内向开放式创新和外向开放式创新两种不同创新策略,利用机会—动机—能力(OMA)理论研究项目团队角色多样性对开源软件项目创新绩效的影响。现有研究多聚焦于项目层级行为动因与个体特征变量,强调参与者社会动机、行为模式对开源项目创新绩效的影响作用。
然而,随着开源项目规模扩大与协作复杂度提升,其制度结构,尤其是嵌入式知识产权治理机制逐渐成为影响开源项目创新能力的关键。越来越多的学者开始关注制度结构对开源项目创新绩效的抑制或激励作用。其中,开源许可证作为开源社区治理的核心规则载体,承担着明确权利义务边界、规范协作行为、调节知识产权冲突的功能(温馨等,2025),成为知识产权治理中的关键制度工具。开源许可证承担着开源社区“基本法”的角色,体现了典型的社群规范属性,各参与主体用开源许可证作为规则约束和行为遵循[10]。因此,从知识产权治理视角出发,系统分析许可证规则特征及其行为影响机制,揭示制度因素如何深度嵌入开源项目运行过程,并最终作用于创新绩效。
在开源许可证和项目绩效关系研究方面,开源社区作为一种高度开放的知识协作环境,通过源代码共享、开发日志披露和协作机制建构,能显著降低知识获取与再利用门槛[11],形成典型的“平台式知识溢出”结构。平台式知识溢出不仅体现为技术内容复用,更通过许可证协议调节知识可获取性和再利用性,直接影响知识溢出路径,进而作用于项目创新绩效。Stewart等[12]探究许可证限制程度对项目绩效的影响;李兰花等[13]通过实证分析,探讨不同传染类型许可证对开发者、用户项目参与和使用偏好具有差异影响。也有一些学者将许可证作为一种治理手段,探究其对项目创新绩效的调节效应。例如,郭海等(2024)将许可证协议这一代表性知识产权治理机制作为调节变量,探究其在开放参与程度与项目绩效之间的调节作用。
综上所述,尽管现有研究在探讨开源许可证对项目创新绩效的影响方面取得一定成绩,但存在一些不足:①多数研究聚焦于传染性维度的规则特征,忽视了许可证本身在复杂性与兼容性方面的结构性差异。②现有研究主要关注许可证规则层属性对创新绩效的直接影响,未充分揭示其对行为机制的间接影响路径。
本文理论贡献主要体现在以下几个方面:第一,拓展许可证规则特征研究视角,系统引入复杂性、传染性和兼容性3类许可证规则特征,刻画开源许可证的制度结构属性。第二,从知识产权治理视角出发,从规则和行为两个维度解读许可证内涵和价值,进一步引入许可证执行偏差作为中介变量,构建“规则—行为—绩效”影响链条,以期为未来相关研究和实践提供启示。
本文从知识产权治理视角出发,构建开源许可证对项目创新绩效影响的理论框架。在开源社区治理体系中,许可证不仅是技术层面的授权协议,还是支撑社区有序协作、知识共创与资源整合的核心制度安排[10]。许可证所承载的规则属性不仅规定知识使用与再分发方式,更嵌入到对贡献者行为的规制机制之中,构成一种制度化治理工具(焦豪等,2022)。因此,开源社区知识产权治理实际上是一种嵌入式制度治理,旨在通过规则制定与行为引导实现对开源社区知识资源配置、使用和保护的规范化干预[14]。在制度理论中,制度被界定为规范人类互动的规则体系,具有稳定行为预期、降低交易成本与协调集体行动的功能[15]。开源许可证作为开源社区正式制度的具体表达,既提供共享与协作的法理基础,又通过条款约束对行为产生引导作用[16]。然而,制度的有效性不仅取决于其设计逻辑本身,更依赖于其能否被理解、接受并在实践中发挥作用。当制度设计存在复杂性、模糊性或兼容性障碍时,便能诱发许可证执行偏差和治理失灵,进而成为抑制创新绩效的隐性风险[17]。同时,开源社区中广泛共享的源代码、技术文档、模型等资源具有高度非排他性与非竞争性特征,是典型的数字公共物品。这类资源一旦开放即可被无限复制、传播,且个体使用不会对他人使用造成稀缺性影响。然而,正因缺乏资源排他性,贡献者可能面临激励不足、责任不清或知识产权归属模糊等问题,导致公共物品供给与使用秩序难以自然维持。在此类资源环境下,仅靠自发行为难以实现稳定供给与合作秩序,还需依赖清晰的制度边界、合理的行为规则和集体接受的执行机制[18]。开源许可证制度作为共享秩序的核心规则安排,正是在这一治理逻辑下形成的。它通过设置使用条件、继承义务与署名规范,在开放性与规范性之间建构治理平衡,承担着资源边界划定、行为约束的多重制度功能。例如,强传染性许可证如GPL会强化开放扩散逻辑,但有可能引发商业兼容性问题;宽松型许可证如MIT有助于促进外部合作,却可能会弱化原项目控制力。这些制度属性对技术扩散路径、项目协作模式与价值实现逻辑构成深层次影响[19]。
基于制度理论与公共资源治理双重理论,本文进一步将许可证所引发的治理机制区分为两个核心维度:其一为“规则特征”,指许可证条款在复杂性、传染性与兼容性维度上所表现出的模糊性、冲突性与执行负担,体现为制度供给侧不确定性与执行障碍;其二为“行为特征”,即许可证执行偏差,指开源项目中贡献者在代码继承、再分发与署名等环节偏离许可证条款要求的行为状态,如未继承原有许可证、擅自变更许可证类型或删除原始署名等,在实质上反映对许可证义务的不完全遵守,是开源社区中不遵守行为的制度化与操作化表征。规则对行为的约束力并非自发生成,而是取决于规则在认知、理解与可操作性层面的实际嵌入效果。规则若存在高度复杂性、语义模糊性或传染性带来的法律不确定性,往往会削弱参与者对其合法性与正当性的感知,进而激发回避、妥协、象征性顺应等策略性行为反应,最终影响制度规则履约与执行[20]。
1.2.1 许可证规则特征与创新绩效
许可证规则特征是指开源许可证在制度设计层面的复杂性、传染性与兼容性,其作为正式制度安排的重要组成部分,通过影响项目资源整合效率与行为协调机制,进而对开源社区项目创新绩效产生实质性影响。本文在知识产权治理视角下,结合制度理论与公共资源治理理论,分析如下:
(1)在开源项目中,许可证的复杂性反映许可证制度规则在条款内容、权利义务设定与使用限制上的多重叠加[21]。根据制度理论,当制度安排难以被理解、解释和内化时,将会显著增加行动者感知不确定性与风险的认知负担,进而抑制其参与积极性与协作意愿[22]。同时,过度复杂的条款结构也会提高制度执行交易成本,使知识资源在社区内部难以顺畅流动,阻碍合作机制的形成与技术整合的推进,最终削弱项目创新能力。据此,本文提出如下假设:
H1a:许可证复杂性负向影响项目创新绩效。
(2)许可证传染性通常指自动化的法律扩展效应。根据限制程度不同,许可证可划分为不同类型,随着限制程度降低,对开源的要求也会逐渐减弱[23]。研究发现,限制型许可证会阻碍开源软件项目创新绩效,削弱以利益为导向的贡献者的参与兴趣[24-25]。但也有研究指出,传染性越高的许可证越能够建立统一的以公共利益为先的规范,协调知识生产者之间的任务分配,进而获取更好的项目结果[26]。本文认为,传染性有时也会成为一种障碍。虽然高度传染性有助于维护开源公共利益边界,但在实践中也可能因条款的强制性与扩张性,限制项目代码的自由集成与商业可用性,尤其在跨项目协作领域或与闭源系统对接时更易触发知识产权侵权风险。这种制度不确定性会降低项目被采纳的可能性,抑制外部协作网络拓展,进而影响知识扩散路径与技术创新活力。据此,本文提出如下假设:
H1b:许可证传染性负向影响项目创新绩效。
(3)不同开源许可证之间相互兼容,尤其是当不同许可证项目合并时,法律、技术兼容和整合是影响技术创新效率及自由度的重要因素[27]。开源许可证兼容性通常涉及对两种或多种开源许可证条款的对比和协调,以确保一个项目代码在多个开源软件和许可证之间能够合法整合和使用。有研究通过分析源代码中许可证使用情况,检测发现商业代码库中开源组件之间存在开源许可证冲突的情况占67%,且开源代码库中包含未经许可的软件占33%[28]。West[29]指出,在开放式平台环境中,不同技术模块之间的协同性依赖于制度规则之间的兼容程度。据此,本文提出如下假设:
H1c:许可证兼容性正向影响项目创新绩效。
1.2.2 许可证执行偏差的中介作用
根据“规则—行为—绩效”传导链条,许可证规则特征不仅在设计层面对创新绩效产生结构性影响,也有可能通过许可证执行偏差影响项目最终绩效。
在制度理论框架下,制度被视为具有规范性、约束性与引导性的行为规则,其治理效能不仅取决于制度本身的设计逻辑,还依赖于行动者对制度的认知、接受与执行偏差。当制度设计存在复杂性、传染性与兼容性等模糊性与不确定性时,往往会弱化其行为规训能力,降低制度嵌入的稳定性,从而诱发参与者的非合规行为(申李莹等,2024),即产生许可证执行偏差。具体而言,规则若在法律语言、权利义务边界或制度逻辑上晦涩冗杂,则容易引发行动者对合规风险的主观感知,导致“理解成本”与“执行负担”显著上升[30]。在开源社区的协同创新实践中,许可证的复杂性、传染性与兼容性特征会在一定程度上加剧这种偏离,使部分参与主体在代码继承、再分发与署名等环节未完全按照开源许可证类型与条款进行执行,表现为未按要求继承许可证、擅自变更许可证类型或删除原始署名等许可证执行偏差行为。这类偏差本质上意味着对许可证义务的不完全遵守,在概念上可视为不遵守行为在制度执行层面的具体表现,这不仅不利于开源技术推广,还会对开源项目成长与发展造成不利影响(郭海等,2024)。朱祖平等[31]认为,类似开源社区这种开放式创新平台会对参与者自我感知效能产生激励或约束影响,从而影响其创新行为;August等[32]从社会层面指出开源许可协议因限制程度和复杂性不同对贡献者会产生不同的经济和非经济激励效应,但当激励程度无法满足贡献者参与开源创作的预期回报时则容易产生违规行为,从而降低开源社区项目贡献质量。据此,本文提出如下假设:
H2a:许可证执行偏差在许可证复杂性与创新绩效之间发挥中介作用;
H2b:许可证执行偏差在许可证传染性与创新绩效之间发挥中介作用;
H2c:许可证执行偏差在许可证兼容性与创新绩效之间发挥中介作用。
综上,本文构建理论模型,如图1所示。
图1 理论模型
Fig.1 Theoretical hypothesis model
GitHub是当前主流的开源协作平台,已广泛应用于软件项目版本控制、协同开发与代码共享领域,成为研究开源项目机制的重要数据来源。为确保样本具备一定开发规模与社区活跃度,且能观测到较为丰富的许可证使用行为,本文基于GitHub Search API在全站范围内筛选fork数超过100的项目作为候选池。为提升样本科学性与代表性,结合项目生命周期、技术特征与结构属性,采用分层随机抽样法,按照以下标准设定分层:①按照创建时间划分为“2020年及以前”和“2021年及以后”,控制项目成熟度差异;②根据主编程语言划分为Python、Java、JavaScript、C++等主要技术栈;③设定“近6个月内至少存在一次有效commit”作为活跃度阈值,剔除不再维护的项目,以避免生命周期偏差带来的数据干扰。
在完成多维分层后,从符合条件的项目中按比例随机抽取样本,获得1 000个原始项目。经数据清洗与有效性检验,剔除存在缺失、结构异常或不活跃的项目,最终纳入分析的有效样本为900个。为验证样本多样性与代表性,本文对其基本特征进行统计分析:①在许可证类型方面,MIT协议占49.1%,GPL占21.0%,Apache占18.7%,其余如BSD、MPL等协议合计占11.2%;②在项目主题方面,软件开发类占72.6%,人工智能算法类占12.9%,数据科学与可视化类占14.6%。样本在技术属性、协议类型与应用场景等维度具有较强多样性和外部效度,为后续实证分析提供了坚实的数据基础。
(1)解释变量。许可证规则特征可进一步划分为许可证复杂性、传染性和兼容性3个变量。其中,许可证复杂性(X1)衡量许可证条款要求覆盖的程度。参考何东杰等(2018)的研究,用开源要求、修改声明、专利允许、许可证兼容、商标使用、网络分发6个方面衡量。许可证传染性(X2)表示许可证传染和限制类型,将具有强传染性的许可证记为1,弱传染性的记为0。强传染性许可证可能会要求所有衍生品也采用相同的许可证,这可能会限制某些贡献者和项目的参与意愿。许可证兼容性(X3)衡量许可证与其它许可证之间的兼容程度,为量化这一变量,本文对900个样本中涉及的17个常见开源许可证构建兼容性矩阵并进行两两兼容性比较,其中高度兼容记为1,一般兼容记为0.5,不兼容记为0,计算每个许可证兼容后的平均得分。
(2)被解释变量:项目创新绩效(Y)。项目创新绩效综合反映开源项目在创新活动中的活跃度和成效。参考Crowston等[33]和王玲等[6]的研究,在基础指标选取上,本文紧密围绕创新绩效核心要素,将7个基础指标划分为4个层面,如表1所示。
表1 项目创新绩效指数
Table 1 Project innovation performance index
一级指标二级指标具体含义项目活跃度y1关注数(Watch)跟踪项目更新数量,反映项目持续关注程度y2提交数(Commit)将本地代码更改保存到Git仓库中的数量,衡量项目开发活跃度社区参与度y3拉取请求数(PR)提出代码更改并请求合并到主分支的数量,体现社区成员的参与和贡献y4星标数(Star)对项目的喜爱或关注数量,反映项目受欢迎程度代码贡献度y5贡献者数(Contribu-tors)项目贡献者数量,衡量项目人力投入项目扩散度y6分叉数(Fork)项目被复制的数量,反映项目扩散和影响力y7问题数(Issues)追踪项目中的错误、漏洞、改进建议等任务数量,是项目在不断吸纳外部知识、识别改进空间、推动功能演化的过程性体现
本文采用主成分分析法测度项目创新绩效指数。在KMO检验值为0.602 9、Bartlett球形检验显著(p<0.001)的前提下,提取3个主成分,累计方差解释率为55.44%。所有变量的提取公因子方差均超过0.6,表明多数变量都能较好地被解释,支持本文采用主成分分析法。通过旋转成分矩阵可以得出,第一主成分由拉取请求数、贡献者数和分叉数主导,反映开发协作与扩散能力;第二主成分由关注数、星标数和问题数构成,代表社区关注度与反馈活跃度;第三主成分提交数主要反映提交频度。各主成分按照方差贡献率加权,构建项目创新绩效综合得分,并作归一化处理,用作被解释变量。在此基础上,进一步使用验证性因子分析(CFA)检验所选指标结构的聚合效度。结果显示,原模型构建的聚合效度(AVE)为0.763,达到可接受水平。因子载荷分析发现,各因子贡献均大于0.5,指标间聚合度较高,进一步验证创新绩效测量模型在统计结构上的合理性与稳定性。
(3)中介变量:许可证执行偏差(M)。此变量描述贡献者修改或继承代码到自己的项目仓库,如不使用原许可证规定的许可证类型或私自删除初始版权者信息等行为状态,用统计Fork未按照许可证类型进行传染的数量和不保留原作者版权信息的次数衡量。
(4)控制变量。参考已有研究,本文选取注册天数、软件大小、版本迭代数量、是否有赞助、语言多样性等作为控制变量[34]。①注册天数(k1),项目从创建到现在天数的自然对数。②软件大小(k2),项目大小的自然对数。③版本迭代数量(k3),项目版本更新次数的自然对数。④是否有赞助(k4),项目有无机构或个人赞助,有赞助记为1,无赞助记为0。⑤语言多样性(k5),编程语言支持两种及以上记为1,只支持1种语言记为0。
本文变量具体定义见表2。
表2 变量定义
Table 2 Variable definitions
变量类型 变量名称 符号 具体测度 被解释变量 项目创新绩效 Y y1~y7主成分分析降维 解释变量 许可证复杂性 X1 条款覆盖范围 许可证传染性 X2 强传染类型记为1,弱传染类型记为0 许可证兼容性 X3 兼容性矩阵的平均得分 中介变量 许可证执行偏差 M Fork未按照许可证类型进行传染的数量和不保留原作者版权信息的次数 控制变量 注册天数 k1 项目从创建到现在天数的自然对数 软件大小 k2 项目大小的自然对数 版本迭代数量 k3 项目版本更新次数的自然对数 是否有赞助 k4 有赞助,记为1;无赞助,记为0 语言多样性 k5 编程语言支持两种及以上记为1;只支持1种语言记为0
本文采用多元线性回归模型进行回归分析,具体模型如式(1)~(3)所示:
Yi=α+βX1i+γ∑Controlsi+εi
(1)
Yi=α+βX2i+γ∑Controlsi+εi
(2)
Yi=α+βX3i+γ∑Controlsi+εi
(3)
为探讨许可证执行偏差在许可证复杂性、传染性和兼容性规则特征与项目创新绩效间的中介效应,本文采用Baron &Kenny[35]的依次回归法进行中介效应检验,具体模型如公式(4)~(9)所示:
Mi=α0+α1X1i+γ∑Controlsi+εi
(4)
Yi=α0+α1X1i+σMi+γ∑Controlsi+εi
(5)
Mi=α0+α1X2i+γ∑Controlsi+εi
(6)
Yi=α0+α1X2i+σMi+γ∑Controlsi+εi
(7)
Mi=α0+α1X3i+γ∑Controlsi+εi
(8)
Yi=α0+α1X3i+σMi+γ∑Controlsi+εi
(9)
其中,下标i代表项目;Yi为被解释变量,代表i项目创新绩效;X1i、X2i、X3i为解释变量,代表i项目许可证复杂性、许可证传染性、许可证兼容性;Mi为中介变量,代表i项目许可证执行偏差;∑Controlsi为控制变量,分别代表i项目的注册天数、软件大小、版本迭代数量、是否有赞助、语言多样性;εi表示随机误差项。
为提高中介效应识别严谨性,本文在传统回归法的基础上,进一步采用Sobel检验和Bootstrap抽样法对间接效应显著性进行检验。具体而言,Bootstrap方法按Preacher &Hayes[36]的路径设定,执行5 000次非参数重复抽样,构造95%置信区间,以增强对中介路径显著性的非正态稳健性支持。同时,为衡量中介效应的相对贡献,本文计算中介效应占比(VAF),用于衡量中介变量在规则特征作用路径下的强度。通过多方法交叉验证,以确保中介效应分析具备路径可识别性、统计显著性与结构合理性。
本文对变量进行描述性统计和相关性分析,本文中多数项目选择的是传染性较弱的许可证类型,其复杂程度较低、兼容性良好。相关性分析结果表明,许可证复杂性(X1)、许可证传染性(X2)、许可证兼容性(X3)与项目创新绩效(Y)之间存在显著相关性。此外,为避免各变量之间存在多重共线性问题,对变量进行方差膨胀因子检验,结果显示Mean Vif=1.98,说明主要解释变量间不存在多重共线性问题。
表3展示了基准回归分析结果。许可证复杂性与许可证传染性对项目创新绩效具有显著负向影响,许可证兼容性则呈显著正向影响,假设H1a~H1c得到验证。许可证复杂性系数为-0.008,达到1%显著性水平,表明条款内容越复杂,越容易加大贡献者的理解成本和合规负担,降低参与意愿,抑制协作活跃度和知识扩散。许可证传染性系数为-0.051,说明强传染性协议(如GPL)虽有助于推动共享扩散,但其严格的继承义务对商业集成与再利用构成约束,会限制闭源协作与商业化路径。许可证兼容性系数为0.112,说明高兼容性协议有利于缓解整合壁垒,提升知识复用与协作效率,从而加快技术集成与创新迭代。
表3 基准回归分析结果
Table 3 Baseline regression results
变量 (1)(2)(3)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)许可证复杂性(X1)-0.008***(-4.136)许可证传染性(X2)-0.051***(-5.938)许可证兼容性(X3)0.112***(4.137)注册天数(k1)0.012**0.014***0.013**(2.516)(2.932)(2.569)软件大小(k2)0.017***0.018***0.017***(9.192)(9.673)(9.169)版本迭代数量(k3)0.016***0.016***0.016***(5.045)(4.976)(5.013)是否有赞助(k4)-0.007-0.007-0.006(-0.914)(-0.940)(-0.765)语言多样性(k5)-0.008-0.003-0.005(-0.825)(-0.372)(-0.544)_cons-0.047-0.068*-0.131***(-1.121)(-1.677)(-3.119)N900900900R20.3540.3710.354
注:*、**、***分别表示在10%、5%、1%水平上显著,括号内为变量回归的t值,下同
控制变量结果表明,项目注册天数、软件大小与版本迭代数量对创新绩效具有积极作用,而是否有赞助与语言多样性未表现出显著影响。这表明,外部资源在缺乏制度支持下难以转化为创新动力,语言差异会造成协作障碍,从而降低沟通效率。
为进一步验证回归结果的稳定性和可靠性,本研究通过细化解释变量、调整样本量、加入遗漏变量和工具变量法进行稳健性检验。
(1)细化解释变量。为避免开源许可证划分方式对结果造成不良影响,将强传染性许可证进一步细分为高传染性和较高传染性许可证。例如,与GPL许可证相比,LGPL许可证的传染性相对较弱。本研究在原有x2变量的基础上,将弱传染性许可证类型记为0、较高传染性许可证记为1、高传染性记为2,细化解释变量后,实证结果表现出较高的稳健性(见表4)。
表4 稳健性检验结果(细化解释变量)
Table 4 Robustness test—refining explanatory variables
变量 (1)项目创新绩效(y)x2type-0.019***(3.640)_cons-0.100**(-2.445)ControlsYesN900R20.351
(2)调整样本量。为避免新成立项目因缺乏市场基础而对研究结论造成干扰以及项目规模过小而导致项目内容无效,本文剔除注册时间小于1个月、规模小于100KB的项目,实证结果与先前结果基本保持一致,表明本文研究结论具有较好的稳健性(见表5和表6)。
表5 稳健性检验结果(剔除注册时间小于1个月的项目)
Table 5 Robustness test—excluding projects with registration time less than 1 month
变量 (1)(2)(3)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)许可证复杂性(X1)-0.008***(-4.051)许可证传染性(X2)-0.050***(-5.854)许可证兼容性(X3)0.109***(4.010)_cons-0.033-0.055-0.117***(-0.774)(-1.313)(-2.680)ControlsYesYesYesN898898898R20.3510.3670.351
表6 稳健性检验结果(剔除规模小于100KB的项目)
Table 6 Robustness test—excluding projects with scale less than 100KB
变量 (1)(2)(3)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)许可证复杂性(X1)-0.009***(-4.326)许可证传染性(X2)-0.051***(-5.871)许可证兼容性(X3)0.121***(4.357)_cons-0.056-0.079*-0.148***(-1.300)(-1.909)(-3.431)ControlsYesYesYesN869869869R20.3550.3690.355
(3)加入遗漏变量。考虑到项目背景变量可能影响许可证选择与项目创新绩效的关系,尤其是基金会主导或企业主导项目制度执行力较强,可能会产生遗漏变量偏差。因此,本文在模型中通过GitHub项目中的owner字段,引入表示企业参与或官方托管的控制变量k6(是否由基金会或知名组织主导),以控制结构性偏差的影响。如表7所示,加入该变量后,主解释变量显著性水平与方向基本保持一致,许可证规则特征的影响路径依然稳健,进一步验证了模型的解释效力。
表7 稳健性检验结果(加入遗漏变量)
Table 7 Robustness test—adding omitted variables
变量 (1)(2)(3)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)许可证复杂性(X1)-0.008***(-4.105)许可证传染性(X2)-0.050***(-5.817)许可证兼容性(X3)0.111***(4.098)_cons-0.058-0.076*-0.141***(-1.362)(-1.829)(-3.313)ControlsYesYesYesN900900900R20.1560.1720.156
(4)工具变量法。为应对许可证规则特征可能存在的内生性问题,本文引入许可证选择年份作为工具变量,采用两阶段最小二乘法(2SLS)进行估计。由于开源许可证在不同历史时期存在结构性演进,项目在时间维度上的许可证选择呈现制度驱动特征,而非由项目创新能力决定,具备工具变量相关性依据[12,37]。本文通过提取项目中首次添加LICENSE文件的时间作为工具变量。如表8所示,在第一阶段回归中,该变量对许可证复杂性、许可证传染性和许可证兼容性均具有显著解释力。LM检验统计量显著,拒绝欠识别假设;Wald F统计量均大于10,表明工具变量非弱,满足识别性与有效性要求。可见,将许可证选择年份作为工具变量在相关性与可识别性方面均成立,主回归结果具有因果解释力和较强稳健性。
表8 稳健性检验(工具变量法)
Table 8 Robustness test(instrumental variables)
变量 (1)(2)(3)(4)(5)(6)许可证复杂性(X1)许可证传染性(X2)许可证兼容性(X3)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)工具变量(iv)-0.075***-0.034***0.009***(-2.607)(-5.181)(4.107)许可证复杂性(X1)-0.616***(-2.630)许可证传染性(X2)-1.381***(-5.225)许可证兼容性(X3)5.432***(4.123)_cons4.836***0.304*0.409***3.016**0.455*-2.187***(6.946)(1.943)(8.159)(2.406)(1.920)(-3.796)ControlsYesYesYesYesYesYesN900900900900900900LM检验16.798***26.263***16.684***Wald F16.79726.84216.867
不同主题类型开源项目许可证规则对项目创新绩效的影响可能具有不同效果。本文对900个样本的Topic主题进行抓取,经过分析和研判后归纳为3类主题:软件开发(应用程序、库、API、开发工具和框架等)、人工智能算法(机器学习、深度学习等算法改进)和数据科学(数据处理、数据分析过程等),对3类主题进行基准回归分析,结果如表9所示。软件开发类项目创新绩效更易受到许可证规则特征影响;人工智能算法项目仅对许可证传染性存在较弱响应,其余不显著;数据科学项目整体上不受显著影响。这种差异主要源于不同项目对知识结构与协作方式的依赖不同,其中人工智能项目通常依赖大量隐性知识(如模型设计、调参经验等),难以通过代码条款充分规范,许可证规则对知识转移约束相对较弱;而软件开发项目以显性知识为主,依赖API接口、模块继承和第三方库集成,规则特征对可用性边界的约束更直接。强传染性协议可能会限制闭源系统集成,兼容性不足也会阻碍模块整合,从而降低协作灵活性与项目创新绩效。此外,从模块化程度看,软件开发项目结构更细致、模块更可拆分,规则限制通过接口外溢至整个系统,许可证耦合效应更明显;而数据科学项目多以脚本流程为主,模块边界松散,主要依赖工具型算法,对规则敏感度较低。异质性回归结果体现出主题差异,反映知识结构、模块边界及协作文化差异性对制度规则的调节作用。
表9 异质性检验结果
Table 9 Heterogeneity test results
变量(1)(2)(3)(4)(5)(6)(7)(8)(9)软件开发人工智能算法数据科学软件开发人工智能算法数据科学软件开发人工智能算法数据科学项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)项目创新绩效(y)许可证复杂性(X1)-0.010***-0.0020.001(-4.112)(-0.331)(0.127)许可证传染性(X2)-0.059***-0.038**0.016(-5.320)(-2.339)(0.717)许可证兼容性(X3)0.124***0.115**-0.039(3.391)(2.398)(-0.640)_cons0.004-0.096-0.199**-0.020-0.097-0.210**-0.089-0.157*-0.182**(0.074)(-1.127)(-2.188)(-0.380)(-1.251)(-2.320)(-1.641)(-1.958)(-1.984)ControlsYesYesYesYesYesYesYesYesYesN653116131653116131653116131R20.3670.3600.4250.3810.4000.4280.3600.4020.427
表10展示了许可证执行偏差在许可证复杂性(X1)、许可证传染性(X2)和许可证兼容性(X3)与项目创新绩效(Y)间的中介效应检验结果。许可证复杂性、传染性与兼容性分别通过许可证执行偏差对创新绩效产生显著中介作用,假设H2a~H2c均得到验证。Sobel检验结果表明,变量在3个维度上均存在显著中介作用。进一步通过Bootstrap法进行5 000次非参数抽样,验证中介效应的稳健性。结果表明,许可证执行偏差在许可证复杂性、许可证传染性、许可证兼容性路径中分别解释35.3%、25.7%和27.1%的总效应,均处于中等强度,说明制度规则通过执行偏差对创新绩效产生实质性影响,尤其是在复杂性较高情境下表现更显著。这是因为,高复杂性、强传染性或低兼容性条款会增加制度理解与执行难度,诱发合规不确定性与行为偏差,阻碍代码复用与协作效率,抑制创新产出。制度规则借助“软性合规机制”嵌入项目实践,构成“制度→行为→绩效”中介链条。然而,中介占比未达到高强度水平,意味着规则特征可能通过其它机制影响创新绩效。一方面,结构性制度限制(如GPL对模块集成的直接约束)可能不依赖行为执行路径即可产生抑制作用;另一方面,行为执行路径本身受开发者认知能力、团队规范与法律环境等多种因素影响,存在不稳定性,会削弱中介传导效果。
表10 中介效应检验结果
Table 10 Mediation effect results
变量 (1)(2)(3)(4)(5)(6)许可证执行偏差(M)项目创新绩效(y)许可证执行偏差(M)项目创新绩效(y)许可证执行偏差(M)项目创新绩效(y)许可证复杂性(X1)1.332***-0.007***(6.773)(-3.429)许可证传染性(X2)2.994***-0.048***(3.391)(-5.584)许可证兼容性(X3)-7.481***0.104***(-2.697)(3.846)M-0.001***-0.001***-0.001***(-2.809)(-3.043)(-3.303)_cons38.695***-0.01144.227***-0.02448.294***-0.079*(9.210)(-0.248)(10.596)(-0.571)(11.218)(-1.775)ControlsYesYesYesYesYesYesN900900900900900900R20.3600.3620.3240.3790.3200.364Sobel检验-2.595***-2.265**2.089**中介占比0.3530.2570.271Bootstrap检验[-0.002 1, -0.000 3][-0.005 3,-0.000 5][0.001 5, 0.014 5]
本文从知识产权治理视角出发,聚焦许可证规则特征及其引发的许可证执行偏差,构建影响开源社区项目创新绩效的理论模型,并基于GitHub平台900个样本进行实证分析,得出如下研究结论:
(1)许可证规则特征对创新绩效具有显著影响,且作用方向依赖于其结构特征。许可证复杂性和许可证传染性显著抑制创新绩效,许可证兼容性则起正向促进作用。复杂条款会增加理解和合规成本,降低参与意愿;高传染性会限制跨项目整合,抑制知识流动;而高兼容性则有助于促进模块协作与知识复用,增强创新活力,表明制度结构在“激励—约束”维度发挥直接作用。
(2)规则特征在不同项目类型中的影响效应存在显著差异。其中,软件开发类项目对许可证复杂性和许可证传染性更敏感,人工智能与数据科学类项目整体响应较弱。这表明,制度工具的实际效力受项目知识结构与协作模式的调节作用。
(3)许可证执行偏差在规则特征影响项目创新绩效过程中发挥中介作用。许可证复杂性与许可证传染性条款更易诱发许可证执行偏差,破坏协作秩序,进而削弱项目创新绩效;许可证兼容性则会降低合规负担,减少违规行为,促进稳定开发与创新产出。验证了“制度设计—行为感知—绩效输出”之间的嵌套逻辑,丰富了开源社区行为治理研究的微观机制视角。
(1)优化规则设计。开源社区制度设计可优化许可证规则结构,从源头上减轻制度负担。一方面,减少条款数量,精简义务结构,明确权利边界,降低制度复杂性;另一方面,增强协议之间的协同解释机制,提升许可证兼容性,避免因协议冲突阻碍项目整合。此外,在控制规则传染性时,需平衡开放共享与商业集成的需求,防止高传染性协议对外部协作形成制度壁垒,从而实现规则激励与约束功能的均衡配置。
(2)推进许可证与项目合理匹配。基于项目目标、技术结构与协作模式差异,合理匹配许可证类型。对于结构高度模块化、依赖多源集成的软件类项目,加强制度规范嵌入,强化规则设计与行为引导联动机制;而对于技术密集度高、创新路径开放度强的算法或数据类项目,可保持制度弹性,避免规则过度干预。社区管理者可构建项目分类支持框架,合理配置治理资源。
(3)规范不合规的许可证行为。开源社区中的知识产权治理重点需由规则设定延伸至行为约束。一方面,在开源平台中开发可视化规则提示工具,对许可条款的关键义务、继承逻辑和兼容边界进行直观呈现,增强贡献者对制度的理解与执行意愿;另一方面,建立基于合规行为记录的社区评价体系,强化合规激励和声誉激活机制,逐步构建对许可证执行偏差的预防和惩戒机制,提升制度规则执行力度。
本文存在以下不足:第一,数据来源存在平台和维度局限。未来可结合面板数据、事件历史数据与多平台样本,增强对制度演化与行为变化机制的动态刻画。第二,创新绩效测量存在优化空间。未来可结合结构方程模型验证潜在结构的合理性,引入外部指标(如技术采纳率、专利引用等)进行实证检验。第三,模型控制变量未涵盖制度环境中的软性机制。未来可通过访谈、社群语料挖掘等方式构建更具有解释力的社会机制变量体系,拓展对制度信任和行为动因的理解维度。第四,需进一步识别与控制潜在内生性问题。项目在选择许可证类型时可能受到预期绩效的影响,存在逆向因果机制。未来可进一步细化指标构建,增强解释变量的结构分辨力。
[1] 汪万,蔡三发.为爱好而贡献?解开为数字技术开源社区贡献的“黄金配方”[J].管理评论,2025,37(3):78-88.
[2] 陈凯华,温馨,朱其罡.我国企业参与开源创新的现状、挑战与政策建议[J].中国科学院院刊,2025,40(3):477-482.
[3] 陈光沛,魏江,李拓宇.开源社区:研究脉络、知识框架和研究展望[J].外国经济与管理,2021,43(2): 84-102.
[4] 胡剑,戚湧.开源创新社区用户知识共享行为影响因素研究——基于SEM与fsQCA的实证分析[J].情报科学,2023,41(9):59-68,77.
[5] 沈占波,王蒙,刘建泽.开放式创新社区治理机制对用户知识共享行为的影响——基于fsQCA的双平台对比分析[J].科技进步与对策,2024,41(9):149-160.
[6] 王玲,董振伟,张庆芝.开源软件项目发起人个体特征对项目绩效的影响——基于GitHub的实证研究[J].科技管理研究,2021,41(20):124-130.
[7] 李英姿,张硕,张晓冬.在线评价对开源设计社区成员创新绩效的影响——以Local Motors为例[J].管理科学,2020,33(3):52-62.
[8] 代君,郭世新,王慧,等.开发人员协同开发行为特征对开源项目成功的影响[J].数据分析与知识发现,2019,3(10):110-117.
[9] TANG T Y, FISHER G J, QUALLS W J. The effects of inbound open innovation, outbound open innovation, and team role diversity on open source software project performance[J].Industrial Marketing Management, 2021, 94(5): 216-228.
[10] 辜凌云.以许可证为核心的开源社区治理逻辑[J].知识产权,2024,38(6):49-61.
[11] 王哲,薛澜,赵静.开源创新组织的创新成本演化与动态治理机制[J].公共管理评论,2024,6(4):108-138.
[12] STEWART K J, AMMETER A P, MARUPING L M. Impacts of license choice and organizational sponsorship on user interest and development activity in open source software projects[J].Information Systems Research, 2006, 17(2): 126-144.
[13] 李兰花,陈真真,黄灿,等.开源许可规制、技术复杂度与开源项目可持续发展:基于GitHub大样本实证研究[J/OL].科研管理,1-23[2025-05-25].http://kns.cnki.net/kcms/detail/11.1567.g3.20241209.1639.018.html.
[14] 胡剑,贾怡炜,戚湧.数字技术创新赋能开源社区知识产权治理的生发逻辑、体系构建与实践路径[J].科学管理研究,2025, 43(1): 59-68.
[15] NORTH D C. Institutions, institutional change and economic performance[M]. Cambridge: Cambridge University Press, 1990.
[16] 张平.开放创新的知识产权应用机制[J].知识产权,2024,38(6):3-17.
[17] 陈水生.公共政策失败及其治理:一个整合性分析框架[J].学术月刊,2022,54(2):91-102.
[18] SAMUELSON P A. The pure theory of public expenditure[J]. The Review of Economics and Statistics, 1954, 36(4): 387-389.
[19] SEN R, SUBRAMANIAM C, NELSON M L.Open source software licenses: strong-copyleft, non-copyleft, or somewhere in between[J]. Decision Support Systems, 2011, 52(1):199-206.
[20] TORFING J, CRISTOFOLI D, GLOOR P A, et al. Taming the snake in paradise: combining institutional design and leadership to enhance collaborative innovation[J]. Policy and Society, 2020, 39(4): 592-616.
[21] 方中秀.知识产权保护、企业创新动力与创新绩效[J].统计与决策,2022,38(24):154-159.
[22] 彭丽徽,周媛,李茜丹,等.风险认知视域下老年人健康信息规避行为要素及关联路径研究[J].情报科学,2024,42(5):101-110,148.
[23] LERNER J, TIROLE J. The scope of open source licensing[J].Journal of Law Economics &Organization, 2005, 21(1): 20-56.
[24] 吴欣,武健宇,周明辉,等.开源许可证的选择:挑战和影响因素[J].软件学报,2022,33(1):1-25.
[25] FERSHTMAN C, GANDAL N. Open source software: motivation and restrictive licensing[J]. International Economics and Economic Policy, 2007, 4(2): 209-225.
[26] GAMBARDELLA A, HALL B H. Proprietary versus public domain licensing of software and research products[J].Research Policy,2006,35(6):875-892.
[27] 王志强.面向SPDX许可证列表的开源软件许可证合规使用研究[D].重庆:西南大学,2021.
[28] SCARLATO M,NOTH L. LCV-CM: a fasten open source license compliance verifier with compatibility matrix[C]. Pakistan:2023 17th International Conference on Open Source Systems and Technologies (ICOSST), 2023.
[29] WEST J. How open is open enough? melding proprietary and open source platform strategies[J]. Research Policy, 2003, 32(7): 1259-1285.
[30] 付少雄,成琦,杨帆,等.多重风险视角下虚假健康短视频的用户分享意愿实验研究[J].现代情报,2024,44(11):67-79.
[31] 朱祖平,阮荣彬,宋格.开放式创新平台激励与约束机制对用户创新行为的影响[J].科技进步与对策,2024,41(3):44-54.
[32] AUGUST T,CHEN W,ZHU K.Competition among proprietary and open-source software firms: the role of licensing in strategic contribution[J]. Management Science, 2021, 67(5): 3041-3066.
[33] CROWSTON K, HOWISON J, ANNABI H. Information systems success in free and open source software development: theory and measures[J]. Software Process: Improvement and Practice, 2006, 11(2): 123-148.
[34] SMIRNOVA I, REITZIG M, ALEXY O. What makes the right OSS contributor tick? treatments to motivate high-skilled developers[J]. Research Policy, 2022, 51(1): 1-15.
[35] BARON R M, KENNY D A. The moderator-mediator variable distinction in social psychological research: conceptual, strategic, and statistical considerations[J]. Journal of Personality and Social Psychology, 1986, 51(6): 1173-1182.
[36] PREACHER K J, HAYES A F. SPSS and SAS procedures for estimating indirect effects in simple mediation models[J]. Behavior Research Methods, Instruments, &Computers, 2004, 36(4): 717-731.
[37] SEN R, SUBRAMANIAM C, NELSON M L. Determinants of the choice of open source software license[J]. Journal of Management Information Systems, 2008, 25(3): 207-240.