科研诚信的度量困境与非理性风险
——面向科研诚信外部规范技术进路的学理反思

刘胜利1,2, 潘云涛2

(1.河南师范大学 图书与档案信息中心,河南 新乡 453007;2.中国科学技术信息研究所 科学计量与评价研究中心,北京 100038)

摘 要:为深入探讨科研诚信外部规范的核心价值目标与技术进路,基于多学科理论视域,对科研诚信度量评价制度化实践的困难根源与非理性风险进行具体考察和学理反思,从而明晰科研诚信的伦理本质及科研诚信评价的社会关系型实践特质,规范科研场域的应然价值尺度和科研著述的原初功能属性,厘清依托公共权威和科研著述度量评价科研诚信的制度化逻辑和制度锁定风险,优化技术进路和制度供给的未来方向。研究结论对于避免盲目的制度迁移与技术借鉴、构建有利于本国科学技术体系自立自强的制度优势、推进科研诚信从危机应对转向长效治理、规范文献计量情报技术的发展与运用等具有基础性理论意义。

关键词:科研诚信外部规范;技术进路;度量评价;科学制度化

The Dilemmas and the Irrational Risks of Measuring Scientific Research Integrity: A Theoretical Reflection on the Technical Approaches to the External Norms of Scientific Research Integrity

Liu Shengli1,2,Pan Yuntao2

(1. Library, Archives and Information Center, Henan Normal University, Xinxiang 453007, China;2. Scientometrics &Evaluation Research Center, Institute of Scientific and Technical Information of China, Beijing 100038, China)

AbstractThe social demand and institutional supply of scientific research integrity are undergoing an evolution and ethical turn from "internal norms" to "external norms". A series of laws, regulations and evaluation standards formulated or recognized by the government and implemented relying on public authority have been introduced into the scientific research behavior norm system to curb scientific fraud and improve knowledge productivity. For instance, peer-reviewed academic works are generally recognized as the academic currency, serving as a credit medium for the equivalent exchange between the scientific research community and the external society;as artificial intelligence and various algorithms are employed to directly detect and measure "paper plagiarism", "data fraud", "idea plagiarism" and even "paper reproducibility" technology, standards and government norms have come into being. Correspondingly, the technical supply and institutional rationality of scientific research integrity measurement and evaluation have aroused wide concern.

Therefore the root causes of difficulties and irrational risks of the institutionalized practice of scientific research integrity metric evaluation, the typical technical approach of external norms are specifically examined and rationally reflected from the multi-disciplinary theoretical perspective. Objectively, the institutional paradigm of internal norms of scientific research integrity relies on the "science-social contract" and "scientific institutional norms" to ensure the integrity and efficiency, and its collapse means that the active construction of a new institutional paradigm around external norms of scientific research integrity by the government is inevitable and beyond the practical scope of empirical judgment. The investigation of academic reflection shows that the measurement and evaluation of scientific research integrity face multiple difficulties, such as how to achieve preset goals, unify evaluation standards,stipulate rigid scales and control human bias;the practice of measurement and evaluation of scientific research integrity involves not only the formation of systems, but also the selection and application of technical methods, and it has the inertia of path dependence and system locking; the benefits of scientific research integrity management relying on public power are not absolute, and they are very likely to produce negative benefits. Besides, the following can be clarified with particular values: (1) the ethical nature of scientific research integrity and the practical characteristics of social relationship evaluation; (2) the natural norm value scale of the field of scientific research and the original functional attributes of scientific research works;(3) the institutionalized logic of measuring and evaluating scientific research integrity and institutional locking risks of relying on public authority.

These reflections suggest that a serious crisis of scientific research integrity and the deterioration of scientific research ecology are actually accompanied by path dependence, system locking, interest barriers and sunk costs; relying solely on the definition of "misconduct" by public power to measure and evaluate scientific research integrity, especially excessive reliance on the control of literature publication, not only breaks the self-organization management logic of creditworthiness and blurs the value system hierarchy that scientific research integrity should have, but also makes judicial authority excessively intrude into the field of moral self-discipline, and increases the social transaction cost of the scientific "recognition-reward" system. Accordingly,in order to optimize technical approaches and their relevant institutional supply, it is essential to focus on the core value goals as protecting the natural rhythm of scientific activities and the self-discipline mechanism of the scientific field, empowering scientific researchers to compete fairly and achieve self-realization, ensuring the local benefits as well as preventing "negative externalities" and "uncertain" ethical risks in science, to (1) break the path dependence and institutional lockdown, (2)clean up the redundant principal-agent relationship, (3)curb the alienation migration of scientific authority, (4)upgrade the scientific "recognition-reward" system, (5)clarify the academic support for decision-making and effectively improve the cognitive level of key target groups.

In general,the present research and its specific recommendations are of basic theoretical significance for avoiding blind institutional migration, building institutional advantages conducive to the self-reliance and self-improvement of the domestic science and technology system, and promoting the transformation of scientific research integrity from crisis response to long-term governance.

Key WordsExternal Norms of Scientific Research Integrity; Technical Approaches; Metric Evaluation; Institutionalization of Science

DOI10.6049/kjjbydc.2022110506

开放科学(资源服务)标识码(OSID):

中图分类号:G311

文献标识码:A

文章编号:1001-7348(2023)20-0021-09

收稿日期:2022-11-18

修回日期:2023-01-03

基金项目:河南师范大学青年社会科学基金项目(XJ2019001401)

作者简介:刘胜利(1979—),男,河南信阳人,博士,中国科学技术信息研究所博士后,河南师范大学图书与档案信息中心馆员,研究方向为科研诚信制度与战略、科研诚信风险评估与管理、科研造假监测与分析;潘云涛(1967—),女,北京人,中国科学技术信息研究所科学计量与评价研究中心主任、研究员,研究方向为科学计量与科技评价、科研诚信监测与体系建设、学术团体改革发展与创新管理。本文通讯作者:潘云涛。

0 引言

作为科学政策的经典议题,科研诚信的社会需求与制度供给具有从内部规范向外部规范制度演进与伦理转向的特点。20世纪80年代以前,科研诚信属于科学社会内部规范的实践范畴,依托道德监督和学术共同体公序良俗促进自律是科学家、政府和公众在面对潜在科研造假或学术不端时的情感倾向和普遍态度。20世纪80年代,美国国会对科研欺诈的揭露与批判瓦解了各种科学例外论,公众舆论和政策辩论语境中不再相信科学可以凭借自身的制度性规范实现诚信。此后,由政府制定或认可并依赖公共权威保障实施的法律、规制和评价标准被引入科研行为规范体系,终结了依赖科学—社会契约和科学制度性规范确保科研诚信与效率的制度范式[1],开启了科研诚信外部规范的时代[2]。当前,全球以学术造假、论文撤稿和同行质疑为特征的舆论事件频频发生,科学社会和科研人员日益陷入学术腐败丑闻和诚信危机[3-4],各国依托公共权力和学术著录行为遏制科学欺诈、提升知识生产效率与本土效益的科学制度化浪潮方兴未艾[2]。一方面,经同行评议的著述被普遍认同为学术通货[5-6],充当科研群体与外部社会等价交换的信用媒介。另一方面,基于人工智能及各类算法直接测度论文抄袭、数据造假、创意剽窃乃至论文复现性的技术、标准和政府规范应运而生[7-11]。相应地,科研诚信度量评价的技术供给与制度理性再度成为科学内外密切关注和争论的焦点[12-18]

客观而论,评价是规范的进路,制度是规范的综合,政府“垂拱而治”的科研诚信内部规范制度范式崩解意味着围绕科研诚信外部规范新制度范式的主动建构不可避免。然而,必须正视的是,缺乏对科研诚信度量评价这一典型技术进路的本质理解和整体把握,政府主导的科研诚信外部规范制度化进程必然充满不确定性。一方面,科学是具有公共性的集体实践,其规范和规范系统既有公共性也有功能性,依托公共权威的科研诚信度量评价既可能利于集体协作、产生“如虎添翼”的效益,也可能意味着僵化内耗和价值异化。另一方面,后学院科学与后常规科学时代,科学技术本身关联的经济政治利益、伦理价值争议、公共安全或生态不确定性往往利害巨大而决策紧迫[19],科研诚信度量评价和跨国监督[12]易在同行竞争与制度竞争中沦为“搭便车”的失控话语权威,被操纵服务于权威垄断、利益博弈乃至非正义与反科学的国际技术殖民、科技体系殖民及各类“代理人”培植。

基于此,本文从本质、源头和原理层面系统考察科研诚信的度量困难与非理性风险,尽其理、究其难,以资修正、深化相关经验认知,明晰科研诚信外部规范的核心价值目标和技术进路,为政府主导的科研诚信建设与科研体制改革提供参考。

1 科研诚信的度量困境及其根源

1.1 经验性伦理预设对科研诚信度量精度与反馈效率的极高要求

高要求意味着目标难以实际达成。按当前科学制度化理论和社会公众对科学去伪存真、追求真理、客观理性的一般理解与伦理预设,科学研究容不得半点虚假和欺骗,何况纳税人实际承担其巨额开支。因此,公众对科研诚信度量评价制度化实践的期待值很高,具有对不当行为“零容忍”的价值诉求。“零容忍”并非科研诚信规范领域的内生词汇,而是来自詹姆士·威尔逊和乔治·凯林的“破窗理论”,其核心思想是提高对轻微违法的处置效率与力度,包括采用争议性“钓鱼执法”传达明确、强硬立场,以提高违法犯罪和公众容忍的心理阈值,防范秩序在消极麻木氛围中崩溃。“零容忍”不但包括执法必严的核心原则,也包括防患于未然、主动出击、立刻行动、绝不姑息任何轻微不当、违者必究的精度与效率。然而,惩治违法犯罪的制度化逻辑迁移到科学诚信外部规范制度化实践中,必然指向难以实现的目标——科学建制中既缺乏专职预警监控、迅速反应的“警察队伍”和“司法体系”,也缺乏历经检验的裁量效率与精准尺度,难以做到类似司法领域裁定违法犯罪那样标准明确、要件具体、逻辑严密、是非边界清晰。相应地,实践中度量评价科研诚信面临诸多技术瓶颈与伦理盲区,尤其当以专业研究和学术著述为目标时,容易形成“以至严之法绳至密之事”的公共管理困局。

1.2 诚信的关系性伦理本质及其评价标准的主观性与相对性

在具体操作层面,诚信及其标准天然的主观性和相对性,使裁断度量科研诚信伴随难以彻底消除的信息约束与共识困境。

1.2.1 科研诚信是诚信在科研场域中的具体存在形式

科研诚信绝不是脱离诚信内涵与外延的新概念。从概念提出及词汇意义看,科研诚信(Research integrity)所传达含义一旦脱离中西经济、文化、道德背景下的实质需求,割离其与经济社会中诚信的本质关联,既不易被内化理解,也不利于科学自身在社会中的制度化发展。毕竟科学制度化意味着科学研究群体及其组织的社会活动从特殊(例外)、非正式、不成熟的方式向被世俗社会普遍认可、成熟有序的固定化模式变迁,客观需要理顺科学与社会间伦理规范和规则系统的价值冲突与利益纠葛,使科研建制与社会建制有机融合、良性互动。因此,科研诚信与负责任的科学研究本质上是诚信伦理价值范畴在科研场域中的具体表现[20]。换言之,集合论意义上的科研诚信(A)、学术诚信(B)和诚信(U)概念所涉事件之间存在子集与全集的数学逻辑关系,即:A⊂U,B⊂U且A∩B≠∅,AB,AB。

1.2.2 诚信及其评价标准天然具有主观性与相对性色彩

在伦理学、法学、经济学及中西文化背景下,基于不同时空场景、主客体关系,诚信具有丰富的主观性含义和多重价值标准。在反对道德驱动论的经济学中,诚信是理性人基于利益博弈的选择;在探讨道德义务本质、起源和发展的伦理学中,诚信是具有前提预设的道德范畴。诚信并非单向、无条件守信和履约,其具有善恶、敌我等上位判断,包含对“内诚于心”主观动机和“外信于人”客观效果的综合评价,贯注着自由、公平、正义、平等互利等基本价值精神。诚信的核心功能在于降低经济社会交往中的交易成本[21],其实践价值集中体现在特定行为主体与外部社会的交互关系上:在藉由自律维系的亲缘关系或熟人社会中,“内诚”大于“外信”;在强调契约关系、法律关系和价值观自由的陌生人社会中,“外信”则重于“内诚”。换言之,道德判断受个人主观价值标准影响。诚信作为协调社会关系的“德目”,不但受根本利益和人类基本需求的规律性驱动,也有群己关系与义利观的实然烙印。这符合马克思阐释的社会规律:“人们自觉不自觉地,归根到底总是他们阶级地位所依据的实际关系——从他们进行生产和交换的经济关系中,获得自己的伦理观念”。

实践层面,即便在成熟严谨的法律与法学体系中,裁断和度量诚信也具有主观性和相对性色彩:①法条中关于诚实信用的表述具有在规范意义上极为模糊,在法律意义上无确定内涵与外延,适用范围几乎无限制的概括化特征[22];②诚实信用原则依赖于法官的自由裁量权;③法条中的诚信既包括表述为诚信的客观诚信,也包括表述为善意、非恶意、不知情等词汇的主观诚信,前者将诚信定义为课加给主体具有明显道德内容的义务,后者定义诚信是主体对其行为符合法律或合乎道德的个人确信——属于客观层面更不易认定的内心状态,比如“纯净的心和空空的脑”[23]

1.2.3 诚信伦理特质使科研诚信度量评价难以摆脱信息约束与共识困境

客观而论,严谨的科研诚信度量评价,必然依赖对行为主体主客观故意的信息采集、分析和证据固定,而信息能够消除随机不确定性[24]。然而,从道德诚信到法律诚信,诚信含义与标准的相对性、模糊性和主观性一以贯之,其中关涉的私人信息,特别是品行秉性、观念习俗、社会交往等倾向具有隐蔽性,信息成本和信息有限理性客观存在[25]。这导致科研诚信的裁断度量必然伴随难以彻底消除的信息约束与共识困境。即便引入成熟的司法程序也是如此:一方面,为防止司法权威过度侵入道德自律领域,产生降低社会道德要求的风险,认定客观诚信需要参考“只有主观上有诚信意识,才可能有诚信行为”的价值预设;另一方面,采信主观诚信时,又有“主观状态并不必然构成诚信,必须受制于社会评价”的客观标准[26]

1.3 科研及其场域很难拘泥于外部规定的纯粹理性与客观

价值尺度层面,科研及其场域很难拘泥于外部规定的纯粹理性与客观。活跃的思维、宽松的氛围、自由的表达、丰富的主客观信息、大胆猜测与假设并积极接受检验的激情,显然更符合科学自身的功能性需求。这也是在诸多科研造假公众舆论事件中隐藏于谨慎介入观点背后的深层逻辑。

1.3.1 科学研究必然伴随经验主义、直觉本能等主观确信

科学研究不等同于科学本身,作为指向科学、由具体化的人所主导的创造性思维与实践过程,科学研究本质上具有深刻的人类行为特点。其既局限于特定时空场域信息结构与伦理文化中具体社会人的认知局限、价值诉求、心理预设、思维惯性和路径依赖,也充满科研人员决策判断时必然伴随的经验主义、直觉本能等主观确信。

个体化的主观确信之所以实然存在并具有合理性,一方面是因为科学的客观性是建立在群体层面主体间相互检验的构造基础之上,在科研人员接力化的知识建构过程中,个体化的主观确信被质疑、提炼和修正,从而去伪存真地指向客观、理性的科学发现;另一方面,科学研究并不局限于归纳、演绎等正统思维逻辑方法,直觉、猜测、想象等非逻辑方法和环节也是爱因斯坦等伟大科学家客观认同并极为重视的创造性过程。事实上,科研人员之间存在不成文的共识:①高品质创意(主观确信)在科研选题和实际开展中极重要,即便缺乏坚实的数据支撑或严密的逻辑推理,好的创意仍会对知识拓展和同行研究产生重要启迪;②在竞争性组织氛围与科研环境中,科研人员极为重视科研意图和思路倾向保密,这是科学活动中的普遍现象和基本行为规律。此外,科研人员推崇创意的行为偏好也表现在同行评议对科研素质的评估过程中,除参考客观层面的成果积累、工作严谨性和数据可重复性外,还尤为看重创意是否具备理论或技术层面的潜在突破价值。在这些隐性场域惯习或科研人员偏好提示中,非逻辑阶段和主观确信属于科研中尚难以有效界定与度量却必须包含和承认的关键智力因素及劳动组分。

1.3.2 科学陈述源于正式交流需求,其核心价值在于可能被检验

历史证明,原始创新、前沿科学往往是从杂乱无序指向理性有序、从主观经验指向客观规律的过程,而可能被检验才是评价具体科研人员科学陈述的合理价值标准。正是基于这一需求,科学中演化出了为控制正式交流方式而精心建立规范:科研论文、研究报告等正式交流媒介通常以典型的被动式和倾向于关注技术问题的模式写成。由此形成科学的两套语言体系[27],其实是基于科学研究中间检验正当需求的匿名设计惯例。其之所以被指责为科学虚伪的证据,并藏污纳垢地关联欺诈、欺骗等嫌疑,逻辑上不可忽视的前提是:①作为科学研究中间产物、供同行评阅的著述被设定为科研绩效指标;②科学界数十年获取外部社会“供养”,导致本应服务于科学自身的学术信息载体和“承认—奖励”系统,脱离了服务于科学自组织交流及反馈的目标和轨道,既催生利用制度漏洞的投机者,也不得不承担被外界功利性评价的义务。当前由科学中心国发起、以论文可再现性为新价值标准的科研诚信评价,并不违背上述政治学逻辑。

反观现实,任何形式的科学方法在实际应用中都做不到完全客观,即使科学出版物让人误以为研究工作充满逻辑和条理性,但实际过程却很少如此,甚至从来都不是井井有条的,大部分科学论文都不会说明研究步骤的真实顺序,也不会解释通过组合和解读实验现象得出结论的过程多么复杂。“错误的思路、研究的死路”和“破碎的试管”这类遭遇或运气虽然是科研工作的真实部分,但论文中极少描述或提起。而且,除已经受住时间检验,不大可能经常变化的典范科学外,另外一类所谓的“前沿科学”往往极不稳定,有时并不可靠,并且会经历大幅修改,对其严格检验会引起错误认识和误解,并可能转变为对科研诚信的指责[28]

可见,科研对经验、直觉本能等非逻辑阶段或主观确信的理性包容,合乎科学良性发展的功能性需求:科研人员无论是受到启迪还是理解现象、提出问题、揭示规律,并不能截然排除偶然性、非描述性和非逻辑性阶段。这呼应了波普尔《科学发现的逻辑》中的经验主义观点——“我们不要求每一个科学陈述在被接受之前必须在事实上已被检验,只要求每一个这样的陈述必须可能被检验”[29]

1.3.3 基于科研著述度量评价科研诚信超出其原初功能属性

基于文献著述度量评价科研诚信,使科学陈述超出其原初功能属性:①信息上达功能,使管理、服务和科研支持方(政府官员、科技发展部门、科研投资人、人才伯乐)提前注意到特定领域有价值的研究、可造就人才及软硬件环境需求;②信息炼化功能,科研工作者通过专业判断、实证分析和融会贯通,对科研实践中的信息进行加工整理,提炼学理性逻辑框架和知识架构,使隐性知识显性化、碎片化知识系统化,深化科学内外经验认知,并方便后续知识的取用、传播和归纳迁移;③科学共同体情报交互功能,基于同行检验和跨领域协同创新目的,报道自身研究工作或技术方案,进行知识记录与传播,使之获得肯定/否定性反馈,方便自己或同行深化经验认知、摆脱路径依赖和思维误区。2021年5月,《知识分子》杂志对袁隆平发表学术论文意义的个案反思,从事实层面支持了科研工作者发表论文的上述核心功能特征。无须讳言,基于论文著述的度量评价,不但使科学陈述超越其原初功能属性,也使学术期刊从专业学术情报筛选、富集、传播的原初功能属性向提供专业学术水平认证权威发生功能迁移与价值异化。

事实上,作为指向科学的中间环节,科学研究及科学陈述中的理性与客观多还是非理性与主观多,既受主体能力强弱和个体偏好影响,也受时空环境和客观外部条件制约。对其必要性、正当性的公平裁断一般基于公共资源分配、同行竞争及非同行比较需求,客观需要多主体具体考察后果、区分主观善恶、权衡潜在利弊,尚难以获得普适性的统一标准和刚性尺度。

1.4 科学场域中的裁判与行政权行使偏差

偏差控制层面,科学场域中的裁判权行使偏差也是科研诚信度量评价的现实困难之一。客观而论,外部规定标准意味着行政化管理科研场域的人对科研诚信程度具有正当裁判权。然而,裁判及行政权力行使毫无疑问同样容易陷入经验主义、基础主义、权威主义、怀疑主义和教条主义窠臼,无法摆脱相对性和主观性色彩。布尔迪厄在《科学之科学与反观性》一书中指出:“科学行政管理人员对科学场域所行使的权力——尽管他们有这种权力,还远远没有受到严格的科学思想支配。”

总之,科研诚信度量评价面临预设目标难达成、评价标准难统一、刚性尺度难规定、人为偏差难控制等多重困难。超越困局,逆向思考,探索舞弊行为背后超出认知的科学场运行规律及潜在需求,似乎不应忽视《背叛真理的人们:科学殿堂中的弄虚作假》一书中基于科研舞弊案例归纳的经验主义观点:“科学家获得新知识,并不单纯依靠逻辑性和客观性”,“科学不应被视为社会中理性的卫士,(理性)只是其文化表达的一种重要方式”。换言之,面对原始创新、颠覆式创新和Serendipity型科学发现的客观社会需求,人们应当反思:为何依赖科学陈述评价科研人员?度量评价作为科研诚信外部规范技术进路的制度化逻辑究竟从何而来?风险何在?

2 科研诚信度量评价的制度化逻辑与非理性风险

2.1 度量评价科研诚信的制度化逻辑

2.1.1 科研诚信社会需求与制度供给中的路径依赖及制度锁定

技术演进和制度变迁通常具有路径依赖惯性,科研诚信的度量评价既涉及制度的形成与制定,又涉及技术方法的选择与应用,因而也不例外。无论是科学契约下的非正式评价与控制模式,还是依托科研不端判定和公共权力行使的科研诚信正式管理,特定历史时空条件下,人们的决策总是倾向于参照过去的选择,并迁移复制既有熟悉范例或现成模式,无论境况是否过时、对象是否变换。

在科学制度化早期,这种路径依赖表现为无条件延续私人捐赠时代自发形成的学术惯例、认同科学自治传统中内生规则的天然合理性与正当性。即便国家财政无条件支持带来了觊觎公共利益的机会主义者和操控公共权力的“金主”或“话语权人”,深度改变了科学社会生态系统组成和利益分配结构,科学自治仍作为官方选择的政策理论和学术体制长期主导“科学—政治”的双边关系,并最终引发外部政治社会对科研诚信及科学产出效率的信任危机与介入监管。管理思想层面也是如此,科研诚信度量评价可归入西方科学管理范畴,强调通过量化、标准化提高劳动生产率,使原本对立的劳资双方围绕效率、质量建立协同关系。不可否认,在简单重复任务下,个人劳动可以用质量和数量标准测度,并且部分科研工作也确实属于简单重复任务。但科学研究管理中最有价值的目标——思想、知识、智慧和创意,其品味和效率仍取决于科学研究相关知识工作者的激情、天赋、能力、责任心和外部环境条件,用衡量体力劳动的方法管理脑力劳动,显然不合理。

历史地看,科研诚信的社会需求与制度供给既不是纯粹科学负外部性引发的自然后果,也不是内生规则自然演进的结果,其与政治社会中的科学制度化路径选择及科学政策理论转向密不可分。当前世界范围内依托公共权力对科研诚信进行正式管理,源自20世纪30年代科学国家主义的形成和20世纪70年代美国国会公开披露、政治化介入科研违规事件,继而在丑闻催动外部监管的舆论化背景下,历经3个发展阶段,形成由政府主导的“惩治—预防—保障”三位一体的制度化局面。其中,通过建立公平透明的查处程序和规则,对学术不端个体进行严厉惩戒的技术路径和制度化理念不但形成最迅速,而且实践最多[30]。换言之,尽管经济学、管理学提出各种人性假设,但诚信仍习惯被科学内外认定为科研活动的一种应然品质或当然义务,是科研人的道德预设。因此,长期以来,依托科研不端定义的负向非定量评价或负向半定量评价及黑名单制度成为一种潜意识选择。这种潜意识选择模式导致科研诚信度量评价对科研不端判定和公共权力行使产生路径依赖及制度锁定。

2.1.2 路径依赖与制度锁定形成的深层逻辑

科研诚信外部规范之所以形成路径依赖和制度锁定,具有其深层逻辑。

(1)认知凝滞导致决策者面对新问题时倾向于迁移过去场景中的解释与反应模式。科学自治作为官方选择的政策理论和初始体制长期主导“科学—政治”的双边关系,使得政府围绕科研诚信外部规范的理论建构与技术发展的探索、试错及反思历程相对短暂,学术界和思想界的伦理探讨并不充分。尤其在丑闻催动科学政策理论转向的舆论化背景下,大多数研究缺乏分析意义。以至于当科研诚信的社会控制不得不从职业伦理向公共政策发生制度性转变时,未能突破一般常规思维和基本套路,表现为以公共权威背书和司法、行政介入打击不端行为的典型路径依赖特征。

(2)群体意识强烈影响科学政策的边际调整。价值信念、风俗习惯、主观偏好、文化传统、意识形态等长期存在于社会观念中的非正式制度具有较强的非变易性,不但自身变迁或演进具有渐进、内生、连续、缓慢等规律,并且深刻影响话语群体对新问题的认知与诉求。在社会舆论中,科研诚信作为科研人员、政治家、新闻记者等群体的新词汇,其判定和度量标准带有不同社会群体固有的职业习惯和政治经济立场。因此,尽管规则权威实际上并不等价于强制力及其指向的惩罚或制裁,但在公众认知中,与规则相比,惩罚是一个更加真切的观察视角。“国家力量被想象得无比强大,公共惩罚资源被认为无限可取,似乎只要有足够的执法力度,所有违法犯罪都可以纳入到法律规定的监控机制与惩罚机制下”。这被威廉姆森描述为“法律中心论”[31]

(3)现存体制造成的利益壁垒与沉没成本。自科学诞生以来,围绕作为核心驱动力的“承认—奖励”系统和同行评议惯例,资助机构、学术出版界、科学共同体、科研组织机构、大学、学者社交圈(如学/协会、学术报告邀约、私人交往、师承关系等公私社会联系)实然形成了与官僚科层、圈层权威、伦理观念、行政权力和资源配置规则(如文献计量化的科研评价)共生的稳固利益分配结构。科学内外利益阶层、马太效应、学习效应、协调效应以及带来的稳定预期的正式/非正式制度,不仅能够降低边际成本、提供强化现存体制的刺激和惯性,使之自我强化、自我积累,形成网络效应(Network Effects),还会产生巨大的沉没成本。藉由行政化途径或法律途径对学术不端个体进行严厉惩戒的制度设置,不但反馈最直接、对现有学术奖励驱动系统与利益结构触动最小,也最符合政府施政场域中由行政权力、司法体系、舆论监督等强制力重建秩序的制度化惯习和大众心理预期。

2.2 科研诚信度量评价的非理性风险

2.2.1 评价标准的外来性、片面性、单边约束性及其风险

自20世纪80年代以来,技术层面对于科研诚信的度量评价,基本等同针对特定科研单元学术不端嫌疑的审查与裁定,其标准高度依赖于科学共同体认定或带有官方权威色彩的科研不端定义。然而,以“伪造、篡改、抄袭”(Fabrication, Falsification, Plagiarism,FFP)规则、论文复现性[10]等为代表的不端标准虽然在规范介入、统一处理尺度方面具有实用性和可操作性,并谨慎明确不包括诚实错误和观点差异,体现出外部规范对科学活动不确定性的谦抑包容,但仍无法避免外来性、片面性、单边约束性及其带来的风险。

就外来性而言,对不端的定义往往直接来自政府文件,尽管会征询部分科学界代表的意见,但仍属典型的政治化、行政化和外来性行为,当规定以最终规则或指导意见的名义公开发布后就具备规范效力。此外,不端定义主要来自科学中心——美国,其权威对美国以外的国家和地区科研不端规范制定和评价技术开发具有变客为主的首因效应和义务督促。然而,无论是发表英文论文、无缝融入科学中心国主导的学术体制和大科学模式,还是接受跨国科研诚信规则和监督,本质上首先服务于本土以外的规则系统和政府利益,科学研究中的思想壁垒、信息壁垒和技术壁垒不可能因为信仰“科学无国界”而消失。

客观而论,适度的外来性有其必要性。因为初始制度选择及其理论容易从意识形态、变革成本等层面产生“锁死”效应,借助外部效应、引入外部变量有利于科研群体突破认知局限,打破既得利益屏障,摆脱制度惯性。但评价标准的外来性也伴随着片面性和单边约束性,进而带来一系列后果或风险。

(1)以偏概全,价值异化。外部标准的制定和执行客观上只能覆盖一部分不端,却在科研人员心理暗示和舆论监督层面削弱“自诚自明”的道德自律义务,产生“法无禁止即可为”的潜规则。一些不宜界定、操作标准模糊、难以约束或监督成本过高、研究者缺乏道德反感的科研不当行为(questionable research practices,QRP)难以成为举报和查处对象,却实然破坏科研秩序、败坏学术风气、严重降低科研体系创新效率与管理效能。尤其在著述被设定为学术通货阶段,科研诚信在概念和范畴上与著述的质、量及学术不端发生评价效用的价值融合。在经济理性驱动下,追求发表数量、影响因子与刊物级别、争抢优先权与原创承认、迅速评职称树立专业权威、提高行政与政治权力地位成为普遍选择,导致评价体系失灵和科研诚信恶意透支。许多罔顾国家R&D战略需求与本土效益、本土学术群体长远利益乃至伦理道德的现象肆意增生,误导公私决策及公共资金投入过度研究、垄断研究、趋势跟风和“科学造神”等更专注于私人和小团体的超额利润等非正当诉求,明明“不忠、不诚”却并无不端。忽视科研诚信伦理本质及其评价标准的社会关系实践特征,单纯依赖外部规定的论文优劣、学术不端标准滥施奖惩,客观上意味着“窃钩者诛,窃国者侯”的价值异化与逻辑悖论。

(2)单边约束,体制僵化。定义不端并非基于正当、公平的双边关系,而是为保护特定利益强制科研人员遵守。例如,定义自我抄袭为不端实际上漠视学术文献本应承担的交流、传播功能,异常强化其版权归属和评价价值,这保障了期刊、版权方和评价方的利益,却会影响乃至抑制学者从不同视角对自我观点重复阐释的权力。一稿多投也是如此,有学者认为这一不端定义既是出版商的霸王条款,也是学界屈从于出版商压力的结果,事实上是处于强势地位的学术期刊给处于弱势地位的投稿人(单方面)定的规则,并强调学术论文本质上属于公共产品,理论上发表的地方越多越有利于学术传播和科技成果转化[32]。单边约束、显失公平的科研诚信规则如同自缚手脚,实际上损害了科研群体的正当权利,必然遏制创新活力,导致科研体制僵化。

(3)权威迁移,利益板结。作为话语权,评价难以摆脱掌控者的政治、经济立场和自身的工具性,利用其议程设置往往可以有效左右受众的重视程度、认知情感和主观共识。规范、规则及相关话语体系客观上不单纯服务于科学本身,还会带上标准制定方的价值倾向和公权私利诉求。虽然由于专业壁垒的存在,科学外部无法单独完成标准制定,不得不基于资格限定或民主代议制形式引入科研界参与,但会分化出专门的话语代表阶层,出现“既当运动员又当裁判员”的“赢家通吃”局面。而且,科研诚信评价标准的外来性不但意味着权威迁移和利益垄断,还导致利益板结。从舆情看,既得利益者热衷于在职称评聘等评价环节利用马太效应负面影响垄断资历、头衔等权威,并通过利益交换合法维护利于自己圈层的科研组织模式或资源分配方案。这种非正常阶层分化带来的利益板结贻害无穷:①组织内卷,评价难以真正建立在公平约束、平等竞争的基础之上,导致围绕科学的“承认—奖励”系统基本失灵;②科学政策决策和科研资源分配充满围绕“名、利、权”的寡头政治与利益博弈;③科研新生力量和补充群体彻底沦为科研活动及科研欺诈中的“韭菜”“临时工”“白手套”“替罪羊”,源头性地毁灭科学自身的自净功能。

总之,评价标准的外来性、片面性和单边约束性不利于构建科学制度的国际竞争优势,难以实现真正意义上的科技自立自强。在超额利润和“赢家通吃”的文化氛围中,不但科学场域中的高马基雅维利主义者选择背弃诚信、投机取巧,科学自身也将丧失其赖以存续的良性秩序与精神特质。

2.2.2 过度依赖公共权力、公共惩罚的逻辑悖论与效益局限

面对欺诈和失序,公共权力和公共惩罚的运用有其必要性。如果没有强制力作为保障,规则容易成为一纸空文,制度的规范、调节等执行力也无从实现。然而,过度依赖公共权力和公共惩罚进行科研诚信外部规范制度化实践却是非理性的。

(1)逻辑悖论。根据委托代理理论,公共权力本质上属于全民共有权力,但现实中不可能由全体公民共同行使,只能由被委托人(机关工作人员)代为行使,需要在国家与私人之间建立“委托—代理”关系。因此,依托公共权力的科研诚信管理,本质上相当于引入一组或多组新的委托代理关系,以防范政府与科研人员之间既有委托代理关系中的诚信风险。毋庸置疑,与原委托代理关系一样,这种新委托代理关系无法免疫其自身存在的天然道德风险。

(2)效益局限。引入公共惩罚的科研诚信管理效率和效益可以用概率符号和语言建立简单数学模型进行量化。假设群体中科研不端的自然概率为PNI,公共权力行使可以使该群体中特定概率的非诚信者受到威慑而改正的概率为PFI,由于新的“委托—代理”关系也具有未知的道德风险,权力行使不当的概率为PNR。按照常理,权力行使不当会导致诚信群体中一部分人(PDSPL)选择不端,二者的关系用函数PDSPL=F(PNR)表述,则原始自然状态的科研诚信概率PDSP1=1-PNI,绝对理想状态下,PDSPL=0,公权介入后的科研诚信概率PDSP2=PDSP+PNI×PFI。相应地,公权介入后的实际科研诚信概率可表达为:PDSP2=PDSP+PNI×PFI-PDSPL= PDSP+PNI×PFI-PDSP×F(PNR),仅当PNI×PFI-PDSP×F(PNR)≥0时,公权介入才具有积极意义。这表明依托公共权力的科研诚信管理效益并不是绝对的,公权介入科研诚信管理极有可能产生负效益。

何况,依托公共权力的科研诚信管理也受成本付出与收益核算的经济规律制约,监督执法的边际收益越低、边际成本越高,委托人的积极性也越低。而且,常规意义上代表公共权威的监督执法同样基于“委托—代理”关系,必然面临科学系统内外“谁应是委托人,谁应是代理人”的委托权分配问题,甚至可能引发政治化的权力争夺与势力范围划分。

3 优化科研诚信外部规范技术进路的思考与建议

当前我国正处于科研诚信建设与科研体制改革关键节点,破除“四唯、五唯”、废除“一把尺子量到底”、倡导“将论文写在祖国大地上”等政策指导意见引发各界对新价值导向、规范体系和评价标准的讨论与期待。为此,需要科学回应跨国科研诚信监督[12],理性兼容科学中心国主导的科研规范和大科学模式,在开放、变动、竞争、合作的全球一体化中理性选择技术进路,建立更加稳妥高效的科研体制和诚信机制。一方面,高效遏制本土科研活动中的机会主义行为,推进科研诚信从危机应对转向长效治理,实现制度建设的根本性、全局性、稳定性和长期性;另一方面,优化创新管理,构建有利于本土科学技术良性发展的制度优势、组织生态和管理模式,促进科研生态良性演替。此外,需要识别科研诚信度量评价制度化实践背后的逻辑,避免盲目的制度迁移与技术借鉴。这显然超越了经验判断的实践范畴,唯有学理可以提供观察、批判和改造的工具。

3.1 学理反思的重要结论及启示

对科研诚信度量困难与非理性风险的学理反思显示:首先,科研诚信并不是脱离诚信内涵与外延的伦理概念,诚信及其评价标准并不是脱离具体社会关系的实践范畴,因此单纯依托公共权力定义不端进而度量评价科研诚信并非科研诚信外部规范的最优技术进路,可能打破诚信的自组织管理逻辑、模糊科研诚信本应有的价值体系层级,还可能使司法权威过度侵入道德自律领域,增加科学“承认—奖励”系统的社会交易成本。其次,科学陈述源于科研人员正式交流需求,其核心价值在于可能被检验,基于文献著述度量评价科研诚信超出了科研著述的原初功能属性。科研人员大量生产符合FFP乃至可复现性标准的学术文献,并不一定意味着其在各种科研关系范畴中是诚信的。最后,日益严重的科研诚信危机和科研生态恶化伴随着路径依赖、制度锁定、利益壁垒和沉没成本,过度依赖文献著述发表环节控制或基于打击惩戒学术不端等经验性、行政化思维产生的技术路径与制度供给,本质上相当于引入一组或多组具备道德风险的“委托—代理”关系,不但使科学场域内生规则权威难以维系,而且可能引入更多“搭便车”的公权私利博弈。

此外,作为道德标准的本土化,科研诚信的外部规范不宜脱离诚信根植的本土道德文化传统与价值范畴。这意味着我国在制定科研诚信外部规范时,应当激发“讲风骨、重操守”的“士”文化动因,夯实学者自发“为天地立心、为生民立命、为往圣继绝学、为万世开太平”的传统价值追求与伦理内核,谋求从控制机制向催化机制(Catalytic Mechanisms)的制度供给转型。管理实践表明,相较于控制对直接标准和度量精度的严苛需求以及诚信培育对于目标实现的不确定性延迟,催化基于不可操纵的指标或不可预测的方式(更难作弊)链接组织目标与绩效,能更确定地将远大抱负变成具体现实。

3.2 优化科研诚信外部规范技术进路的未来方向与具体建议

基于上述结论,优化科研诚信外部规范的技术进路必须正视诚信的关系型特质和科学自组织发展的深层驱动需求,摆脱过度依赖公共权威的直接评价与泛行政化控制,具体围绕以下方向展开:①保护科学活动自然节律与科学场域自律机制;②赋能科研人员竞争公平与价值变现自由;③保障科研本土效益,防范科学负外部性和不确定伦理风险,破除路径依赖和制度锁定,清理冗余的“委托—代理”关系,遏制科学权威异化迁移,升级科学“承认—奖励”系统,明确决策的学理支撑并有效提高关键目标群体的认知水平,以之约束公权、疏导私利,完善科学社会建制,消除马太效应的负面影响,激发、催化科研人员以科学为志业,忠诚守信的创新创业激情。

为此,提出如下建议:

(1)破除干扰诚信自律的制度设置,清理科学“承认—奖励”系统中冗余的“委托—代理”关系。首先,废除依附于职业建制的科研职称序列,建立面向学术关系、劳动关系和劳动价值内在决定类型的职称认定与报酬反馈制度。其次,重新定义科学“承认—奖励”与科研学术文献发表流程的时序关系,颠覆优先权承认的传统机制,解除评价权威与著述出版环节的“委托—代理”关系,促使学术期刊通过更有价值的情报富集、学术信息传播等专业化劳动服务科研,获取专业权威。最后,打破传统依赖于“委托—代理”关系和官僚科层的“单位+员工”基础科研组织模式,构建基于自赋值聚类的新型科研建制模式与权力—权威结构,促进自组织重复博弈和检验监督,在风险可控领域建立公平合理的科学研究自组织拨款(Self-organized funding allocation,SOFA)制度。

(2)赋能自组织的科研价值变现与重复博弈,促成“数—智—人”与信用利益天然一致的元宇宙,最大限度消除从创意到学术成果或市场产品的外部条件限制与剽窃风险,保障荣誉、财富归劳动者与价值创造者。首先,基于“平台+个人”模式引入信用中介和重复博弈,建立服务于科研活动的公共交易平台,使科研人员能轻易冲破外部条件制约,从“不得不弥补短板”到能“自由充分发挥长板”,推进科学研究从作坊式向更高效率、更高水平的自组织协作升级。其次,促进科研人员劳动分工与角色分化,完善围绕科研活动的(信息、产品、人力资源)供给与需求生态链,使研究者既可以只通过归纳提炼学术问题、设计研究方案获取智力劳动报酬,也可通过具体执行调查、检测和分析获取一般劳务报酬。当前,科学中的职业化分工不发达,科研人员要想取得成功,不仅要有新颖可行的创意,还需要通过大量条件允许的基础性工作获得有效的技术性证据,这一过程中单打独斗、粗制滥造、利益相关者人为干扰限制乃至创意被同行剽窃的风险都极大。最后,简化科研人员注册公司开展或组织技术咨询服务的流程,基于大数据和互联网建立“行为—信用—能力—人格”的科研致富杠杆,催生大量有活力的小微企业,形成科研创富潮流。

(3)设置防范科研负外部性伦理风险的政府机构,推行科研生态保育评价标准与奖惩反馈制度,保护科研创新及科研人员成长的自然节律。具体地,有效抽检涉及公共利益的国家科技计划项目、生态环境评价、生命医学研究及各类标准制定与品种审定,惩戒危害公共利益、透支政府公信力的伦理失序、科研欺诈和垄断行为,保障惩罚的技术品质;保育科研生态,废除科研活动中的时间性规则限制,消除时间限定、年龄限定对科学研究和科研人员成长自然节律的干扰,堵严利用时间限定和年龄限定操控竞争规则的各类投机漏洞。

(4)参照TOP(Transparency and openness)准则[33-34]提供科研人员评价同行研究的技术辅助,拓展人脑机能,提升同行监督效率。具体地,依托透明的文献计量指标和评价模型,将原属科研群体内部的隐性知识与潜规则转变为易于公众理解和监督的显性知识与明规则,基于开源透明的机器算法和人工智能直接测度分析特定科研人员文本抄袭、图片加工、观点剽窃乃至论文复现性风险;明确度量评价科研诚信的技术原理及正当运用主体,将科研不端评价技术作为科研人员评判同行研究的日常工具,确保科研诚信度量工具的公共性与易得性。

(5)强化对高校和科研院所有组织科研水平的计量评价与政策引导,鼓励面向科研诚信的信息增值服务、学术增值服务和管理服务。鼓励基于管理模式、管理技术、管理知识和价值变现渠道的商业化输入,优化传统科研单位的科研流程管理,提升科研单位的科研组织效能,实现科研人员与科研单位效益双赢。

(6)建立更优化的科研诚信规则生成系统,提升关键目标群体对科研诚信和科学不确定性风险的认知与决策水平。

总之,科研诚信外部规范应规范文献计量的发展与运用,致力于制度与战略的整体性优化,推动技术、组织、市场、战略等要素的有机协同整合。制度从根本上决定人才、资金、内生驱动力等核心竞争优势的国际转移,各国政府若能面向未来建立更为优越、合理的科研体制机制,以确保科学研究的诚信、效率和本土效益,就能在新一轮科技革命与科技竞争中获得更多致胜机会。

参考文献:

[1] 大卫·古斯顿, 龚旭. 在政治与科学之间:确保科学研究的诚信和产出率 [M]. 北京: 科学出版社, 2011.

[2] 刘胜利, 潘云涛, 赵筱媛. 科研诚信外部规范合目的性与合规律性的理论分析 [J]. 现代情报, 2020, 40(9):53-59.

[3] LI T. Five ways China must cultivate research integrity [J]. Nature, 2019, 575(7784): 589-591.

[4] TITUS S L, WELLS J A, RHOADES L J. Repairing research integrity [J]. Nature, 2008, 453(7198): 980-982.

[5] FOGARTY T J. Show me the money:academic research as currency [J]. Accounting Education, 2009, 18(1): 3-6.

[6] QUAN W, CHEN B, SHU F, et al. Publish or impoverish: an investigation of the monetary reward system of science in China (1999-2016) [J]. Aslib Proceedings, 2017, 69(5): 486-502.

[7] VANI K, GUPTA D. Detection of idea plagiarism using syntax-semantic concept extractions with genetic algorithm [J]. Expert Systems with Applications, 2017, 73: 11-26.

[8] ROOSTAEE M, SADREDDINI M H, FAKHRAHMAD S M. An effective approach to candidate retrieval for cross-language plagiarism detection:a fusion of conceptual and keyword-based schemes [J]. Information Processing &Management, 2020, 57(2): 102150.

[9] AHUJA L, GUPTA V, KUMAR R. A new hybrid technique for detection of plagiarism from text documents [J]. Arabian Journal for Science and Engineering, 2020, 45(12): 9939-9952.

[10] NATIONAL ACADEMIES OF SCIENCES E, MEDICINE. Reproducibility and replicability in science [M]. Washington, DC: The National Academies Press, 2019.

[11] RESNIK D B, NEAL T, RAYMOND A, et al. Research misconduct definitions adopted by U.S. research institutions [J]. Accountability in Research, 2015, 22(1): 14-21.

[12] MACILWAIN C. Scientific misconduct: more cops, more robbers[J]. Cell, 2012, 149(7): 1417-1419.

[13] BENJAMINI Y. Selective inference: the silent killer of replicability [J]. Harvard Data Science Review, 2020, 4(2):1-31.

[14] ZUCKERMAN H. Is "the time ripe" for quantitative research on misconduct in science [J]. Quantitative Science Studies, 2020,1(3): 945-958.

[15] NICHOLS J D, OLI M K, KENDALL W L, et al. Opinion:a better approach for dealing with reproducibility and replicability in science [J]. Proceedings of the National Academy of Sciences, 2021, 118(7):e2100769118.

[16] LEWANDOWSKY S, BISHOP D. Research integrity:don't let transparency damage science [J]. Nature, 2016, 529(7587): 459-461.

[17] FANELLI D. Is science really facing a reproducibility crisis, and do we need it to[J]. Proceedings of the National Academy of Sciences, 2018, 115(11): 2628-2631.

[18] MARTIN B R. Whither research integrity?plagiarism, self-plagiarism and coercive citation in an age of research assessment [Z]. Elsevier,2013: 1005-14.

[19] 廖苗. 科学的社会契约与后常规科学 [J]. 自然辩证法研究, 2014, 30(10): 54-59.

[20] 唐壮, 聂培琴. 建立并完善道德自律和法律规制互动的科研诚信体系 [J]. 科研管理, 2008,29(S1): 98-100,90.

[21] 道格拉斯·C.诺思. 制度、制度变迁与经济绩效 [M]. 杭行,译.上海: 格致出版社, 2014.

[22] 徐国栋. 诚实信用原则二题 [J]. 法学研究, 2002, 24(4):74-88.

[23] 徐国栋. 英语世界中的诚信原则 [J]. 环球法律评论, 2004, 26(3): 366-375.

[24] SHANNON C E. A mathematical theory of communication [J]. The Bell System Technical Journal, 1948, 27(3): 379-423.

[25] 刘胜利, 潘云涛, 赵筱媛. 科研数据造假判定实用情报策略与技术的宏观考量 [J]. 现代情报, 2017, 37(12):3-9.

[26] 徐国栋. 客观诚信与主观诚信的对立统一问题——以罗马法为中心 [J]. 中国社会科学, 2001,22(6): 97-113,206.

[27] 迈克尔·马尔凯. 科学社会学理论与方法 [M]. 林聚任,等,译.北京: 商务印书馆, 2006.

[28] FRANCISL.MACRINA. 科研诚信:负责任的科研行为教程与案例 [M].北京:高等教育出版社, 2011.

[29] 波普尔. 科学发现的逻辑 [M]. 查汝强, 邱仁宗, 万木春,译.杭州: 中国美术学院出版社, 2008.

[30] 李真真, 黄小茹. 中国科研诚信面临的突出问题及解决路径 [J]. 科学与社会, 2017, 7(3):107-120.

[31] 桑本谦. 私人之间的监控与惩罚:一个经济学的进路 [M].济南:山东人民出版社, 2005.

[32] 马建平. 一稿多投正当性的法理分析及其权利规制 [J]. 现代出版, 2012,19(3): 18-21.

[33] NOSEK B A, ALTER G, BANKS G C, et al. Promoting an open research culture [J]. Science, 2015, 348(6242): 1422-1425.

[34] MAYO-WILSON E, GRANT S, SUPPLEE L, et al. Evaluating implementation of the transparency and openness promotion guidelines:the TRUST process for rating journal policies, procedures, and practices [J]. Research Integrity and Peer Review, 2021, 6(1): 1-11.

(责任编辑:陈 井)