基于关联规则与信息熵的技术融合趋势研究

苗 红1,张俊哲1,黄鲁成1,2,娄 岩1

(1.北京工业大学 经济与管理学院,北京 100124;2.首都社会建设与社会管理协同创新中心,北京 100124)

摘 要:根据从德温特专利数据库中检索的专利数据,运用Apriori关联规则算法得到关于技术融合趋势的关联规则,然后通过基于差异思想的兴趣度模型验证规则的有效性,并在关联规则基础上利用信息熵评估企业核心技术领域分布及变化情况。最后,以安川电机和发那科公司为例进行实证分析。研究结果显示,基于差异思想的兴趣度模型弥补了关联规则因阈值设置主观性较强而导致部分规则无效的问题。

关键词:技术融合;关联规则;兴趣度模型;信息熵

0 引言

近年来,一些领头公司在其商业领域通过提供服务、产品及技术来建立商业生态系统[1]。商业生态系统是一个以相互关联的组织和个人为基础的经济群落[2]。在商业生态系统中,中小企业会受到众多因素影响,其中就包括技术融合。技术融合可以提高公司竞争力。在这种背景下,及时了解商业生态系统中的技术融合趋势对于中小企业来说至关重要。由于资源的稀缺性,对于中小企业来说,识别和了解商业生态系统中的技术融合趋势,进而针对融合趋势进行研究与开发很重要。首先,技术融合可以创造新产业[3],新的融合技术有助于提高公司商业多样化。其次,商业多样化会提高公司竞争力。因此,了解技术融合对于公司来说有百利而无一害。

关于技术融合趋势的研究中,有一些是分析专利信息的,如专利引用关系[4]、摘要[5],或者是利用德温特世界专利索引[6,7],很少有针对商业生态系统的技术融合趋势分析。Jungwoo等人[8]应用文本聚类和关联规则,预测商业生态系统背景下的技术融合趋势,但是没有考虑到关联规则方法中因指标阈值设置的主观性而可能导致规则不具有实际指导意义的问题。基于这种情况,本文提出一个研究框架,该框架可以识别商业生态系统中的技术融合趋势以及龙头企业的核心技术领域,弥补关联规则因阈值的设置而导致部分规则无效的缺陷。本研究结果可以为商业生态系统中的中小企业寻找新的商业机会提供参考。

1 理论基础

1.1 技术融合

最早关于技术融合的研究可以追溯到20世纪60年代,N·Rosenberg[9,10]发现虽然有些产业的最终产品不同,但是从技术角度来看这些产业关系紧密,在生产流程以及待解决的技术问题上有很多共同之处,所以技术融合从技术的角度解释了产业发展。児玉[11]认为技术融合是将多种现存技术整合成新技术的过程,同时,技术融合过程并不是技术间的简单叠加,它赋予融合技术以新的属性,最终形成新市场。Schnaars等人[12]认为当两项或更多截然不同的技术结合时,技术融合就可能产生。技术融合过程具有很强的动态性,同时,可以创造新的商业机会[13]。这个过程使现存的产业边界变得模糊[14],从而创造全新的产品和产业[3,12]。Philip在2016年发表的文章中建议美国启动新的国家级科研计划“融合科研计划”[15]

为了理解技术融合,很多学者利用专利信息进行研究。他们采用专利引文分析法和专利共现分析法研究技术融合。Sung等人[16]应用专利的前项引用与后项引用分析技术融合。Karvonen和Kassi[3]通过分析射频识别技术在产业价值链中的作用来研究技术融合。黄鲁成等以我国信息与生物技术融合专利为研究对象,运用数据挖掘的关联分析探讨信息与生物技术融合趋势。邱均平等[17]采用信息计量学的关键词词频分析和共现分析方法,以物联网、大数据、云计算、语义网为例,从4个层面分析技术融合结构并进行一致性分析,设计了技术融合结构的计量方法。

1.2 关联规则

本文运用关联规则方法预测技术融合模式。关联规则是数据挖掘的主要技术之一,它反映事物之间的相互依存性和关联性,分析的对象是事务。根据样本和算法,会生成很多规则,然而并非所有规则都是有效的。如果规则达不到预先设置的阈值,规则就是无效的。判断规则有效性的常用指标有3个,如表1所示。生成的规则要同时大于预先设置的最小支持度(Suppmin)与最小置信度(Conmin),才是强关联规则,同时,在强关联规则中,提升度(lift)大于1的规则被称为有效的强关联规则,反之称为无效的强关联规则。

表1 关联规则的有效性和实用性测量指标

指标说明公式支持度测量简单关联规则的普遍性,表示项目X和项目Y同时出现的概率support(X→Y)=support(X∪Y)=P(X∪Y)置信度测量简单关联规则的准确度,描述了包含项目X的事务中同时包含项目Y的概率,反映X出现条件下Y出现的可能性confidence(X→Y)=P(Y|X)提升度反映项目X的出现对项目Y出现的影响程度。一般大于1才有意义,意味着X的出现对Y的出现有促进作用lift(X→Y)=P(Y|X)/P(Y)

1.3 基于差异思想的兴趣度模型

基于差异思想的兴趣度模型可以帮助进一步分析关联规则,排除因阈值设置而产生没有实际指导意义规则的问题。关联规则的置信度和支持度是常见指标,但是使用置信度和支持度的提炼规则并不是完全有趣的,如果把阈值设置得过低,就可能产生一部分不具有实际指导价值甚至有误导性的规则,如果把阈值设置得过高,又可能会排除掉一些具有实际指导意义的规则。因此,人们对得到的规则进行相关性分析,通过引入兴趣度来排除实际意义不大的规则,以保证规则都是有趣和具有指导意义的。Anand等人[18]提出基于差异思想、应用于特征规则的兴趣度的定义,而周欣、周皓峰等人[19,20]在此基础上,将兴趣度运用到关联规则中,定义规则X→Y的兴趣度为:

Interest(XY)=

Interest(X→Y)表示规则X→Y的兴趣度,Con(X→Y)表示规则(X→Y)的置信度,Supp(Y)表示规则(X→Y)中规则后项Y的支持度。

由兴趣度的公式可知,规则的置信度与规则后项的支持度不存在数量关系,故计算出的兴趣度既可能大于0也可能小于0。分母Max{Con(X→Y),Supp(B)}是一个标准化因子,确保计算得出的兴趣度在[-1,1]之间。该兴趣度综合了规则的置信度与规则后项的支持度,反映了Y在X影响下发生的概率与自身发生概率的差异。如果一条规则的兴趣度越大,则说明这条规则的实际利用价值越大;反之,该规则反向的实际指导作用越大。

1.4 信息熵

本文基于关联规则和兴趣度使用信息熵,可以在技术融合趋势中分析得出核心技术。信息熵的概念由Shannon[21]提出,用来衡量系统的复杂性。后来很多学者将信息熵应用于分析技术融合与关联规则。Eun Jin Han等人[22]应用信息熵评估每个专利的国际专利分类码的融合潜力,也有学者把信息熵的概念应用于关联规则的筛选[23,24,25]。本研究基于关联规则,将信息熵应用于核心技术的分析。核心技术信息熵的定义如下:

其中,Ei代表某关联规则中规则后项的熵值,j代表的是含有规则后项i的关联规则。Pj/i代表的是含有规则后项i的规则j的数量除以事务i的总数量。信息熵值越大,代表该技术在企业中越处于核心地位。

2 研究设计

本文提出一个研究框架,可以识别商业生态系统中的技术融合趋势以及龙头企业的核心技术领域。首先,运用关联规则分析专利数据,提炼专利数据中国际专利分类码之间的联系,从而得出技术融合趋势;然后,采用基于差异思想的兴趣度模型对规则的实际意义进行评估;最后,在经过关联规则和基于差异思想的兴趣度模型分析后,运用信息熵对关联规则中的规则后项进行分析,得出基于关联规则的公司核心技术领域,如图1所示。

图1 研究框架

在关联规则中,Apriori算法应用广泛,可以对数据的关联性进行分析与挖掘,挖掘出的信息在决策过程中起到重要作用;但是在运用关联规则前要人为主观设置阈值,会因为阈值设置问题而产生没有实际指导意义的规则。对于这种缺陷,本文提出运用基于差异思想的兴趣度模型加以弥补,既保证了关联规则算法的有效性,也解决了阈值设置主观性的问题,进一步完善了研究框架的科学性与合理性。

2.1 数据来源

据国际机器人联盟(IFR)数据显示,工业机器人领域前四大公司为日本发那科(FANUC)、德国库卡(KUKA Roboter)、瑞士ABB以及日本安川电机(Yaskawa Electric)。其中,日本发那科和安川电机公司在工业机器人方面有突出成就,在全球有很高的市场占有率,这两家公司都与中国公司合作;发那科公司于1997年成立上海发那科公司,是最早进入中国推广机器人技术的跨国公司;安川电机公司与首钢合作成立安川首钢机器人有限公司,近期又与杭州凯尔达合作成立公司。这两家公司无论是在机器人产业领域,还是从对中国机器人市场的影响来说,都是举足轻重的。所以,本研究根据这两家公司的专利权人名称和代码,在德温特数据库中检索出专利数据,时间为1974-2016年,共检索出17 042项专利,分为6个时间段,结果如图2。

图2 专利检索结果

2.2 变量设定

本研究采用前四位国际专利分类码,较为适合研究技术融合趋势,同时,将专利号(PN)和国际专利分类码(IPC)整理成关联规则分析所需的事务表,如表2。

表2 技术融合趋势分析事务表

TID项集XIPC1IPC2…IPCmPN11000PN20100……………PNn0001

2.3 通过关联规则分析公司技术融合趋势

本研究运用关联规则分析公司技术融合趋势。采用前四位而不是全部国际专利分类码进行分析,这是因为由8位国际专利分类码表示的技术领域过于详细,不适合作技术融合趋势分析。

2.3.1 通过Apriori算法生成技术融合规则

表3和表4展示了按照时间顺序排列的安川电机与发那科公司的技术融合规则,划分成6个时间维度是因为可以从时间维度观察公司的技术发展趋势与重点发展技术,每5年划分为一个阶段,第一个阶段是1974-1990年,这两家公司在初始阶段的专利申请数很少,不利于作技术融合分析。在分析阶段,本文把时间框架分为两部分,即1974-2010年和2011-2016年。原因是,1974-2010年间的规则可以用公司已经生产的产品加以验证,从而说明本文所用关联规则的正确性,在此基础上根据2011-2016年的规则结果进行预测,之后进行基于差异思想的兴趣度模型与信息熵评估核心技术领域就了一定的有效性和科学性。

根据表中数据可知,运行Apriori算法共生成31条规则,这些规则的各项指标都大于预先设置的阈值(Conmin≥50%,Suppmin≥2%,lift>1),说明这些规则都是强有效规则。

由表3可知,在1974-2010年的5个时间段,共有20条规则。大部分的技术融合与调节或者控制系统有关(G05B),少部分与塑料成型产品的后处理、控制或调节系统有关(B29C)。

从基于关联规则的结果可以看出,这一阶段两家公司的技术研发重点都在G05B上。工业机器人的5个关键要素是伺服系统、控制器、核心算法、精密减速器、应用和集成技术,而G05B正是伺服系统的相关技术领域。

表3 1974-2010年的关联规则

时间规则支持度(%)置信度(%)提升度1974-1990B22D→B29CG05D→G05BB23Q→G05BG06F→G05B2.2263.7465.86310.47878.04966.66766.66755.4408.9852.9912.9912.4881991-1995B22D→B29CG05D→G05BG06F→G05BB23Q→G05B4.7103.7244.7655.96983.72163.23559.7755.0465.4603.3663.1822.9301996-2000G05D→G05BB23Q→G05BH02P、G05B→G05D6.3125.8802.32666.31655.93252.8572.8192.3788.3742001-2005G06F、B25J→G05BG05D、H02P→G05BG05D→G05BB23Q→G05B2.4222.2866.5514.40180.28268.65756.77155.8143.6433.1152.5762.5322006-2010G06F、B25J→G05BG05D、H02P→G05BG06F→G05BB23Q→G05BG05D→G05B2.4692.6069.6365.7616.79079.16764.47455.16053.57153.0303.4302.7942.3902.3212.298

表4 2011-2016年的关联规则

时间规则支持度(%)置信度(%)提升度2010-2016B65G、H01L→B25JB22D→B29CB65G→B25JH01L、B25J→B65GG05D→G05BB23P→B25JG06F、B25J→G05BG06F→G05BB23Q→G05BB65G、B25J→H01LH01L→B25J2.2432.1314.5982.9162.5052.5422.3935.75711.8134.0375.34698.33398.24687.80575.64173.13469.11862.50061.03958.86154.6354.5453.66914.1293.27616.453.1152.5792.6622.6002.50710.2192.035

事实上,安川电机公司在1983年参加了日本通产省大型工程计划(极限作业机器人的开发),同年,“AC伺服驱动”产品化。1991年开发AC伺服Σ系列,1993年在英国开始生产变频器,2005年新一代工业用机器人(双臂机器人、单臂机器人)产品化,2006开始销售小型通用变频器V1000,2007年开始销售AC伺服驱动Σ-V系列,2010年大型风力发电用系统电机Enewin产品化。相比于安川电机公司,1974年发那科公司基于伺服、数控基础的工业机器人问世,1976年投放市场,之后公司一直致力于数控装置的研发与生产,1980年至今发那科公司研发生产的数控装置有F0、F10/F11/F12、F15、F16、F18系列。

以上两家公司产品研发与生产的历史说明,在1974-2010年的5个时间段中,利用关联规则对两家公司专利数据的分析基本正确,由Apriori算法生成的规则基本都出现在两家公司的产品中,说明本研究所运用的关联规则是可靠的,可以在2010-2016年的规则基础上进行技术融合趋势预测,以及后续基于差异思想的兴趣度模型与信息熵评估核心技术领域。

由表4可知,2011-2016年间共有11条规则。从规则整体构成来看,与之前技术融合多发生在G05B领域不同的是,这个时期也有一部分技术融合发生在B25J领域。G05B表示一种调节或者控制系统,B25J表示机械手臂。

与机械手臂技术领域可能发生融合的其它技术领域分别是运输或贮存装置,例如装载用输送机、车间输送机系统、气动管道输送机(B65G);半导体器件,其它类目中不包括的电固体器件(H01L);金属的其它加工、组合加工(B23P)。值得注意的是在机械手臂技术领域含有B65G、H01L以及B25J这三项技术的关联规则反复出现。通过观察这些规则可以发现,这三项技术之间都有关联,特别是B65G、H01L→B25J这条规则的置信度高达98.333%,说明在B65G和H01L已经联合使用的情况下非常可能与B25J融合。B23P→B25J规则在这个阶段首次出现,同样,规则前项B23P也是伴随B25J首次出现,说明B23P技术目前最可能应用的领域就是B25J(机械手臂)领域,如果有公司开发和研究B23P这类技术,那么这家公司的产品极有可能是与机械手臂有关。综上所述,在机械手臂技术领域,B65G、H01L以及B25J非常重要,相互之间经常发生融合,B23P是B25J领域的新技术,它的出现说明该公司产品很有可能涉及机械手臂方面。

与G05B技术可能发生融合的其它技术领域分别是非电变量的控制或调节系统(G05D)、电数字数据处理(G06F)、机械手臂(B25J)、机床的零件、部件或附件,如仿形装置或控制装置(B23Q)。纵观全部时间段可以发现,含有G05B的规则在2011年前占有非常大的比例,说明1974-2011年间安川电机和发那科公司的产品大部分涉及G05B领域,而在2011-2016年之间,G05B相关规则的比例大幅降低,而B25J相关规则急剧增加,说明两家公司很有可能在研究开发与B25J相关的新产品。G05D、G06F以及B23Q三项技术在整个时间段作为规则前项都与G05B出现过,说明这三项技术可能在G05B涉及的产品,即伺服器和数控装置中具有重要地位,这三类技术的融合趋势可能是该类产品技术融合的核心趋势,同时,关注到G06F、B25J→G05B这条规则在2001-2005年间开始出现,余下各个时间段均有出现,并有较大置信度。另外G05B与B25J是2010-2016年间两大技术融合发生的领域,所以它们之间的融合可能预示两家公司的新产品技术融合方向。其中,G06F不仅与G05B融合频繁,而且还出现在G06F、B25J→G05B这条规则中,说明G06F技术不仅在G05B领域比较重要,而且在G05B与B25J的融合中也比较重要,可能预示着应用于机械手臂的伺服器的研究与开发。

B22D→B29C规则在一开始就出现,但是在1996-2010年间没有出现,然后在2010-2016年间突然出现。通过查找1974-1995年间两家公司的产品资料发现,B22D和B29C两项技术出现在变频器与早期的数控装置产品中,可能是由于两项技术的应用已经很成熟或者是由于公司的研发团队找到了替代这两项技术的技术。但是这两项技术的融合又在最后一个时间段出现,经过对专利数据的查阅,发现这两项技术也出现在机械手臂(B25J)中,而机械手臂的相关技术融合是在2010-2016年间大量出现的,所以本文认为B22D和B29C的融合很可能是发那科公司在数控装置方面寻求的创新,或者是把数控装置应用于机械手臂当中。

2.3.2 基于差异思想的兴趣度模型验证规则有效性

由于本文划分的6个时间段中,前5个阶段都可以用两家公司的实际产品来验证规则的有效性,而最后一个时间阶段,即2010-2016年没有实际产品来验证,故本文使用基于差异思想的兴趣度模型只针对2010-2016年间的规则分析其有效性,具体数据如表5所示。

基于表中数据可以得出,2010-2016年间11条规则的兴趣度全部大于0,说明规则前项的发生对于规则后项起到促进作用,即某规则前项代表的一项或者两项技术在一起使用时非常有可能和规则后项代表的技术进行融合。如H01L、B25J→B65G规则的兴趣度大于0并且非常接近1,说明当H01L、B25J一起使用时非常有可能与B65G这项技术进行融合。如果这条规则的兴趣度小于0,则说明当H01L与B25J这两项技术在一起使用时,倾向于不与B65G所代表的技术进行融合。

表5 2010-2016年规则兴趣度

规则兴趣度2010-2016H01L、B25J→B65GB22D→B29CB65G、B25J→H01LB65G、H01L→B25JB65G→B25JG05D→G05BG06F、B25J→G05BG06F→G05BB23P→B25JB23Q→G05BH01L→B25J0.93920.92920.90210.72740.69470.67900.62440.61540.61220.60120.5086

半导体器件,其它类目中不包括的电固体器件(H01L);运输或贮存装置,例如装载用输送机、车间输送机系统、气动管道输送机(B65G)与机械手臂(B25J),这三项技术反复出现在规则中且规则的兴趣度很大,说明这三项技术对于安川电机和发那科来说很重要,在其产品研究与开发中,这三项技术相互融合的趋势要高于其它技术融合趋势。所以,从兴趣度的角度来看,H01L、B25J与B65G这三项技术及其之间的融合是相当重要的,含有这三项技术的关联规则具有很大的实际指导意义,也进一步说明这两家公司有可能重点开发机械手臂领域的产品。

关于一般的控制或调节系统(G05B),这项技术的相关规则的兴趣度虽然都大于0,但是与机械手臂(B25J)的相关规则相比,都比较小。出现这种情况的原因可能是,虽然G05B所代表的伺服系统一直都是两家公司的产品重点,但是2001-2005年间就有机械手臂(B25J)的出现,可能预示着两家公司有意将产品重点转向机械手臂或者将机械手臂技术转化成研发重点,使其与公司现在的伺服系统技术进行融合,进一步突破现有技术壁垒,最终实现产品创新。所以,从兴趣度的角度来看,机械手臂领域的关联规则普遍比伺服器关联规则的实际指导意义大。

2.4 利用信息熵评估关联规则中的核心技术领域

前文通过关联规则分析两家公司的专利数据,从而得到技术融合趋势,然后通过基于差异思想的兴趣度模型验证规则,保证其有效性。经过以上两部分分析确实可以得到并预测两家公司的技术融合趋势,但是在融合中并不只有一项技术,哪项技术占有主导地位无法通过关联规则及兴趣度模型加以判断。所以,本研究引入信息熵概念,并在关联规则的基础上评估各项技术的重要程度,也可以理解为识别技术融合中的核心技术领域。

在本研究中,由关联规则的前项推出规则后项,也就是在已经出现的技术或者技术组合(规则前项)条件下还可能与哪项技术(规则后项)融合,即规则后项所代表的技术是预测重点。所以,本部分使用信息熵概念来分析规则后项代表的技术,如表6所示。

表6 基于2010-2016年关联规则中规则后项技术领域的信息熵值

时间IPC信息熵值1974-1990G05B1.2978B29C0.46161991-1995G05B1.2281B29C0.50201996-2000G05B0.8366G05D0.45472001-2005G05B1.36012006-2010G05B1.4472G05B1.4636B25J1.30842011-2016H01L0.5270B29C0.5198B65G0.5084

表6展示了6个时间段中规则后项所代表技术的信息熵值。可以看出,G05B的熵值一直很高,从关联规则的角度看,2010-2016年间与G05B技术相关的关联规则大幅减少,但是其信息熵值还是很高,说明两家公司有意将研发重点转向B25J领域,但是两家公司可能还是以G05B领域技术为主,G05B这项技术在两家公司的研究与开发中一直处于重要地位,属于核心技术领域。B25J的熵值仅次于G05B的熵值,说明其重要性突出,也属于核心技术领域,并且结合关联规则所占比例来看,两家公司的新产品很可能与B25J技术领域有关。H01L与B65G作为与B25J一起出现的两个技术,它们的熵值小于B25J的熵值,说明在技术重要性方面不如B25J的,即在这三项技术融合中B25J是核心技术领域也是主导技术领域。再看B29C这项技术,经过前面分析,B29C在1974-1995年间出现,可能是应用于变频器和早期的数控装置产品中,而对于2011-2016年这个时间段来说,B29C很可能应用于机械手臂领域,并且其熵值相对较小,在机械手臂领域不属于核心技术范畴。

3 结语

本研究提出了分析技术融合趋势与识别核心技术领域的方法框架。首先,运用关联规则分析企业专利数据,得出规则进而分析技术融合趋势。其次,使用基于差异思想的兴趣度模型验证规则的有效性。最后,在前面研究的基础上,使用信息熵的概念识别技术融合中的核心技术。该框架弥补了关联规则由于阈值设置而可能产生实际指导意义不大的规则的问题,同时,在关联规则的基础上评估核心技术领域,可以更加准确地为企业提供指导。

基于对安川电机和发那科两家公司专利数据的研究,本文得出结论:技术融合主要发生在关于一般的控制或调节系统(G05B)和机械手臂(B25J)两个领域。在机械手臂领域H01L、B25J与B65G三项技术及其之间的融合模式相当重要。在一般的控制或调节系统领域,G05D、G06F以及B23Q与G05B融合频繁。而且G06F、B25J→G05B这条规则说明,B25J与G05B之间的融合可能预示了两家公司的新产品技术融合方向。通过兴趣度的验证,2010-2016年间所有关联规则都是有效的,并且再次验证了H01L、B25J→B65G这条规则的实用性。最后,在关联规则结果的基础上,运用信息熵概念分析核心技术领域,得出结论:G05B这项技术在两家公司的研究与开发中一直处于重要地位,属于核心技术领域;B25J的熵值仅次于G05B的熵值,说明其重要性突出,也属于核心技术领域;B29C虽然是应用于机械手臂领域的新技术,但是其重要性不显著,不属于核心技术领域。

本研究对商业生态系统中的中小企业实践有重要指导意义:提供的框架可以为商业生态系统中的中小企业提供领头企业的技术融合趋势以及核心技术领域的相关信息。中小企业管理者可以根据分析结果找到他们感兴趣的领域,并且以此为依据,决定是否购买相关技术或者改变公司战略,也可以决定是否更新自己的产品。

本文只是以工业机器人领域的两家领头企业为例进行研究,提出的研究框架可以应用于其它产品领域。专利数据是结构化数据,虽然不同产品领域涉及的专利内容不同,但专利数据均为同构数据,并在不同程度上呈现融合趋势。因此,可以应用本文提出的研究框架进行分析,分析结果将有利于企业缩短产品研发周期、节省研发成本、降低市场风险。

参考文献:

[1] LANSITI M,LEVIEN R.The keystone advantage: what the new dynamics of business ecosystems mean for strategy,innovation,and sustainability[J].Personnel Psychology,2004,20(2):88-90.

[2] MOORE J F.The death of competition: leadership and strategy in the age of business ecosystems[J].Sirirajmedj Com,1997.

[3] KARVONEN M,KSSI T.Patent analysis for analysing technological convergence[J].Foresight,2011,13(5):34-50.

[4] GUPTA V K,PANGANNAYA N B.Carbon nanotubes: bibliometric analysis of patents[J].World Patent Information,2000,22(3):185-189.

[5] YOON J,CHOI S,KIM K.Invention property-function network analysis of patents: a case of silicon-based thin film solar cells[J].Scientometrics,2011,86(3):687-703.

[6] WILSON R M,SPECIALIST T I.Patent analysis using online databases—technological trend analysis[J].World Patent Information,1987,9(1):18-26.

[7] CANONGIA C,ANTUNES A,PEREIRA M D N F.Technological foresight—the use of biotechnology in the development of new drugs against breast cancer[J].Technovation,2004,24(4):299-309.

[8] SUH J,SOHN S Y.Analyzing technological convergence trends in a business ecosystem[J].Industrial Management & Data Systems,2015,115(4):718-739.

[9] ROSENBERG N.Technological change in the machine tool industry,1840-1910[J].Journal of Economic History,1963,23(4):414-443.

[10] ROSENBERG N.Exploring the black box: technology,economics and history[J].Economic History Review,1994,48(1).

[11] 児玉,文雄,BRANSCOMB L M.Emerging patterns of innovation : sources of Japan's technological edge[M].Harvard Business School Press,1995.

[12] SCHNAARS S,THOMAS G,IRMAK C.Predicting the emergence of innovations from technological convergence: lessons from the twentieth century[J].Journal of Macromarketing,2008,28(2):157-168.

[13] ANTONIONICITA,GIOVANNI B.RAMELLO,FREDERIC M SCHERER.Intellectual property rights and the organization of industries: new perspectives in law and economics[J].International Journal of the Economics of Business,2005,12(3):289-296.

[14] ATHREYE S,KEEBLE D.Technological convergence,globalisation and ownership in the UK computer industry[J].Technovation,2000,20(5):227-245.

[15] SHARP P,JACKS T,HOCKFIELD S.Capitalizing on convergence for health care[J].Science,2016,352.

[16] SUNG K,KIM T,KONG H K.Microscopic approach to evaluating technological convergence using patent citation analysis[C]// U- and e-service,science and technology-international conference[A],2010:188-194.

[17] 邱均平,杨强.技术融合的计量分析——以4种新兴信息技术为例[J].图书情报工作,2014(14):90-97.

[18] ANAND S S,PATRICK A R,HUGHES J G,et al.A data mining methodology for cross-sales[J].Knowledge-Based Systems,1998,10(7):449-461.

[19] 周欣,沙朝锋,朱扬勇,等.兴趣度——关联规则的又一个阈值[J].计算机研究与发展,2000,37(5):627-633.

[20] 周皓峰,朱扬勇,施伯乐.一个基于兴趣度的关联规则采掘算法[J].计算机研究与发展,2002,39(4):450-457.

[21] SHANNON C E.A mathematical theory of communication[C]//Mathematical theory of computation[M].McGraw-Hill,1974:3-55.

[22] HAN E J,SOHN S Y,PHILLIPS F.Technological convergence in standards for information and communication technologies[J].Technological Forecasting & Social Change,2016,106:1-10.

[23] 潘碧琦,潘建科,刘军,等.基于关联规则和复杂系统熵聚类的痛风用药规律研究[J].中华中医药杂志,2014(6):2040-2043.

[24] 刘乐乐,田卫东.基于属性互信息熵的量化关联规则挖掘[J].计算机工程,2009,35(14):38-40.

[25] 梁宝华,汪世义,陈新河,等.信息熵-依赖度框架的关联规则挖掘[J].金陵科技学院学报,2013,29(1):28-33.

(责任编辑:胡俊健)

Research on the Trend of Technology Convergence Based on Association Rules and Information Entropy

Miao Hong1,Zhang Junzhe1,Huang Lucheng1,2,Lou Yan1

(1.School of Economics and Management, Beijing University of Technology,Beijing 100124,China;2.Collaborative Innovation Center of Capital Society-Building & Social Governance, Beijing 100124,China)

Abstract:Based on the patent data of Derwent Innovations Index, using Apriori Association Rules Algorithm to get association rules about technological convergence trend, then the validity of the rules can be tested by the different ideological interest model, on the basis of the rules, we can use the information entropy to evaluate the core technology area in the enterprise, and the changes over time. The framework of the different ideological interest degree model based on association rules can compensate some invalid rules caused by the threshold setting, that is, subjectivity is much stronger. The research take the Yaskawa and Fanuc Ltd as an example, and then come to the conclusion:the results proved the feasibility and effectiveness of the framework, and provide guidance for small and medium sized enterprises in the selection of key development technologies and products.

Key Words:Technological Convergence; Association Rule; Interestingness Mode; Information Entropy

收稿日期:2016-12-02

基金项目:国家社会科学基金重大项目(11&ZD140);北京市教委青年拔尖人才培育计划项目(011000543114502)

作者简介:苗红(1977-),女,吉林镇赉人,北京工业大学经济与管理学院副教授,研究方向为科技管理;张俊哲(1990-),男,内蒙古通辽人,北京工业大学经济与管理学院硕士研究生,研究方向为科技管理;黄鲁成(1956-),男,河北徐水人,北京工业大学经济与管理学院教授、首都社会建设与社会管理协同创新中心研究员,研究方向为科技管理、技术与项目管理、技术未来分析等;娄岩(1963-),男,北京人,北京工业大学经济与管理学院副教授,研究方向为新兴技术管理与产业创新。

DOI:10.6049/kjjbydc.2016100009

中图分类号:G301

文献标识码:A

文章编号:1001-7348(2017)16-0001-06