技术领域维度下相对技术关联度研究
——以德温特专利数据库共类分析为例

李勇敢

(河南省知识产权事务中心,河南 郑州 450008)

摘 要:回顾以往网络技术结构、核心技术及新技术出现、技术融合与扩散使用方法、步骤,分析以往科学计量学和专利计量学共现分析中的标准化工具,根据杰卡德系数在专利计量学中的应用,提出相对技术相似度和相对技术关联度概念,以此改进以往杰卡德相似系数及杰卡德距离在共现分析中的不足,并对德温特专利数据库中的手工代码进行实证分析。

关键词:相对技术关联度;杰卡德相似系数;德温特手工代码;共类分析

1 文献综述

自Narin[1]于1994年提出专利计量概念并利用专利间引用关系分析技术结构后,专利技术结构研究可分为以下几个方向:一是利用专利引文进行分析,如Narin等[2]、Meyer等[3]、Tijssen等[4]、Li等[5];二是利用共引分析,如Xianwen Wang等[6]、Rodriguez等[7];三是利用共类分析,如Hyunseok Park等[8]、Chunjuan Luan等[9]。相比之下,专利引文分析方面的研究文献较其它方法(共类分析)多。截至2015年4月20日,笔者用“patent citation”、“patent co-citation”、“patent co-classification”分别在Web of Science核心合集(1900-2015年)、Springer link及Elsevier SD数据库中不限年份进行主题检索,结果如表1所示。从中可见,专利共类分析相关文献相比专利引文和共引分析文献少。

表1 专利共类分析和共引分析检索结果

检索结果WebofScience核心合集(1900-2015年)Spring⁃erlinkElsevierSD数据库patentcitation主题检索14147789312patentco⁃citation主题检索3539747patentco⁃classifica⁃tion主题检索246436

1.1 专利共类分析文献回顾

Engelsman等[10]对技术类别进行了宏观和微观研究。McCain[11]依据专利间共类关系研究了技术网络结构;Leydesdorff[12]利用专利归属类别分别研究了三位类别代码和四位类别代码技术领域之间的关系。Park等[13]运用专利技术IPC共类关系,对KIPO(Korean Intellectual Property Office )进行了研究,并运用Freeman[14]的ANP方法对核心技术和网络中间中心度进行了测度,类似文章还有《Identification of technological knowledge intermediaries 》[15]

1.2 将共类关系作为技术领域之间关联标志的可行性分析

在科学计量学领域,共类分析没有引文分析应用广泛,笔者认为主要原因有两个:一是各学科之间差别较大;二是科学文献分类系统没有专利技术之间分类更加详尽和规范。但是,引文分析也并非没有缺陷,就像科学文献引文一样,专利之间的引用更多强调技术之间的传承或继承关系,而非并行或平行关系。另外,虽说专利分类代码是索引工作人员强加于各项专利的,但也并非是随意分门别类的,而是根据专利技术涉及领域和所要解决的问题进行分类[16]

本文借鉴Marshakovr和Small提出共引分析可表示两个文献通过两个技术类别共同出现在同一条专利文献,来分析两个技术类别之间的关联关系。

Leydesdorff在其论文中提出共类关系是技术之间关联的潜在标志;OECE[17]明确提出技术相关标志有两个:一是专利之间的相互引用,二是技术之间的共类关系。根据Si等[18]的论述,Breschi等已经表明专利之间的引用关系不适合技术领域之间的关联分析,这在Leydesdorff的研究结论中也得到了验证。

1.3 “技术相似性”研究综述

对于技术共类分析,首先需要解决的就是技术距离或相似度测评问题。在以往文献中,测度技术之间的距离一般是基于企业之间拥有的差异化技术进行度量,如Leiponen等[19]提出的The min-complement distance measure。另外,Leten等[20]度量了公司技术关联性或一致性。也有学者利用专利技术关键词出现频率作为专利向量,运用欧氏距离对向量之间的距离进行度量,如Yoon等[21]和Chang等[22]

根据王贤文等[23]的论述,文献共被引标准化方法有两个:Salton余弦系数和Jaccard系数[24-25]。在共类分析中,国内外大部分学者都是利用杰卡德相似系数和Salton余弦函数。 Leydesdorff[24]对Salton余弦函数和杰卡德系数进行了详细比较。本文认为,Salton余弦函数在统计学中可描述两个变量之间的相关程度,但并非适合两个技术领域之间的关系度量。

关于杰卡德相似系数的由来,Rousseau[26]表述得十分清楚:它是由杰卡德[27]于1901年提出、用来衡量两个集合之间相似度的一个指标,杰卡德距离(Jaccard Distance)被定义为1减去Jaccard相似系数,其是杰卡德相似系数的补集。因此,两个集合之间的距离(差异度)可用d(X,Y)=1-r(X,Y)表示。

王贤文等[28]根据Small对于两个文献之间的共引分析,提出了专利共引分析杰卡德系数矩阵计算方法。其中,coc(i,j)表示公司i和j拥有专利的共引次数,cit(i) 和 cit(j)表示公司i和j拥有专利分别被引用的次数,其以此分析了世界前五百强企业技术结构与相互引用的关系。栾春娟[29]提出了德温特共类杰卡德系数矩阵计算公式。

基于上述文献回顾,笔者发现,自Narin提出专利计量、Small[30]提出利用杰卡德系数分析科学文献共被引并构建相关矩阵后,很少有学者对共被引矩阵或共类矩阵标准化方法进行比较研究,只有Leydesdorff L[24]开展了这项工作。

以上文献均未给出计算两个或多个技术类别之间的“相对”关联度。关联度其实是一个相对概念,如技术类别A相对于技术类别B的重要性或关联性程度。

2 技术类别之间关联度度量方法

每个专利技术在类别中应是无序的。因此,本文运用杰卡德相似系数进行类别相似度或相似度分析。但利用杰卡德相似系数衡量技术间的相似度存在一定缺陷:由杰卡德相似系数公式进行分析,不管两大技术领域所含专利数量的差值有多大,只要两大技术领域专利总量和共现(或共类)数量不变,那么其杰卡德相似系数也是不变的。

图1 数量相近两大领域共类

图2 数量差别较大两大领域共类

如图1和图2所示,当用杰卡德相似系数评估AB两个技术领域的相似度时,不管nA >> nB,还是nB = nA,只要nA+B = nA′+B,并且nAB = nA′∩B,根据杰卡德相似系数公式,则认为图1和图2两种情况技术相似度一致。由此可见,杰卡德相似系数并不能很好地测评两个技术领域之间的关联度或相似度。因此,应该用一个更加细致的共现分析方法分别度量两个技术领域的相对关联度或相似度,故本文引入“相对技术相似度”或“相对技术关联度”概念,具体计算方法如下:

TF-ATF-B分别表示两个不同技术领域,用nAB代表同时拥有两种分类代码的专利数量,那么技术分类A相对于B的技术关联度(技术相似度)RAB可表示为:

(1)

其中,nAB代表技术分类AB两个分类代码共现的专利技术个数;nA代表技术分类A中包含技术专利的个数。

同理,技术分类B相对于技术分类A的技术关联度(或技术相似度)RBA可表示为:

(2)

其中,nB代表技术分类代码B中所含专利个数。

根据这种思想,可构造出一个不同分类代码之间的技术关联矩阵,并称之为对称矩阵。

当然,也可以利用专利技术类别之间的相互引用数量测算技术关联度(相似度),nAB代表两个技术领域内共引现象的次数。

任意两个技术领域之间的相似度可用以下公式表示:

(3)

RAB的取值范围在[0,2]之间,只有两个技术领域完全重合时,RAB的取值为2,完全不存在共类时为0。

任意两个技术领域之间的距离DAB可表示为:

(4)

DAB的取值范围也在[0,2]之间,只有当两个技术领域完全重叠时,两个技术领域的距离DAB才会取值为0;当两个技术领域代码完全不存在共现时,DAB的取值为2,这样就完成了技术领域关联矩阵的标准化。

3 技术关联度实证分析

在进行技术领域关联度分析时,本文选取德温特专利数据库手工代码进行分类,因为其相对于其它分类更加细致。由于每个类别层级不一致,每个技术领域深度和广度也不一致,所以可忽略各技术领域层级问题,即在任何两个不同层级德温特手工分类代码中,都可以进行技术关联测度。

另外,需要注意的是:不同层级德温特手工分类代码之间并非包含关系,检索V01手工代码,记录只有5条,而V01-A02记录有1 426条, V01-A02A5B记录有2 640条。显然,各级别手工代码专利群之间并非包含关系,而是一种更为细致的分类关系,这在IPC分类代码中也得到验证。IPC分类虽然有的也达到六级,但层级之间专利数量并非只是包含关系。例如:在德温特专利数据库中检索A01B,记录为33条,而其下一级子目录A01B-001/00却检索到1 531条记录,A01B-001/06检索到558条记录。显然,不同层级分类代码,不管是IPC分类代码还是其手工代码在德温特数据库中并非包含关系。

德温特专利数据库手工代码可以达到六级分类。例如,V:(ELECTRONIC COMPONENTS)——V01 (RESISTORS AND CAPACITORS)——V01-A (RESISTORS)——V01-A02 (FIXED RESISTORS)——V01-A02A (THERMISTORS)——V01-A02A1 (NOVEL THERMISTOR COMPOSITION)——V01-A02A1A (MANUFACTURE OF THERMISTOR MATERIAL)。而其德温特分类代码只达到两级。例如,V (Electronic Components)分类目录中只有V01 Resistors and CapacitorsV02(Inductors and Transformers)和V03(Switches,Relays)3个子分类。从以上分类可以看出,德温特手工代码更为细致和准确。

笔者选取德温特手工代码V01-A02A1A(MANUFACTURE OF THERMISTOR MATERIAL)的目的有两个:一是电阻是最常见的电子元器件;二是V01-A02A1A是最底层的手工代码,不能再进行分类,技术领域之间的关系比较细致、准确。在研究技术类别之间的关联时,虽然可以V01类别进行检索,但这样进行研究是不准确或者不可靠的,因为V01包含电阻和电容两类,它们是两个性质完全不同的电学元器件概念,工作原理和生产工艺完全不同。因此,不能简单地用高度概括分类代码进行类别之间的关联研究。

截至2015年4月20日,笔者在德温特数据库中,年代选取1963-2015年,检索V01-A02A1A手工代码,共检索出85条记录,涉及257个德温特手工代码类别。如,标注V01-A02A1A类别共85个,占100%;标注L03-B01A2专利记录共59条,占69.412%;标注V01-A02A5B类别共32条,占37.647%,见表2。笔者选取其中包含此类专利最多的前17种分类进行分析。然后,对每个类别进行单独检索和两两共类检索,得到基于德温特手工分类代码的技术关联矩阵或技术共现矩阵,如表3所示。

表2 手工代码V01-A02A1A检索数据

字段:德温特手工代码记录数占比(%)V01⁃A02A1A85100.00L03⁃B01A25969.41V01⁃A02A5B3237.65V01⁃A02A5A1821.18V01⁃A02A11618.82A12⁃E101214.12S03⁃B01F1112.94V01⁃A02A7A1112.94V01⁃A04K11112.94X12⁃D01B910.59A08⁃M09A67.06A09⁃A0367.06A12⁃E07C67.06V01⁃B03A367.06E35⁃K0455.88L02⁃A0255.88L02⁃G07D55.88

从表3可以看出,在V01-A02A1A技术类别中,与其共类比例最高的是L03-B01A2(HEAT SENSITIVE RESISTORS)。但在L03-B01A2类中,共检索到3 071条专利,与其共现率最高的不是V01-A02A1A,而是V01-A02A5B,占其所有专利技术的32.563%。截至2015年4月20日,上述17个类别共包含专利技术226 975条。根据表3及公式(1)、(2),可求出每个技术专利分类的相对技术关联度或技术相似度,如表4所示。利用表4每个技术领域的相对技术关联度,并依据公式(3)、公式(4),可计算出两两技术领域之间的距离,如表5所示。

表3 技术关联矩阵(技术共类矩阵)

字段:德温特手工代码V01⁃A02A1AL03⁃B01A2V01⁃A02A5BV01⁃A02A5A...L02⁃A02L02⁃G07DV01⁃A02A1A85593218...55L03⁃B01A25930711000381...63283V01⁃A02A5B3210002640199...2385V01⁃A02A5A183811991245...2256V01⁃A02A116379296166...1760A12⁃E1012490346100...4734S03⁃B01F11450124314...364V01⁃A02A7A1116668118...15V01⁃A04K111468355324...5087X12⁃D01B9431720...32115A08⁃M09A620921712...314A09⁃A03621522412...299A12⁃E07C635124975...93109V01⁃B03A361673...1266E35⁃K0452472...19240L02⁃A025632322...25489157L02⁃G07D52838556...1573300

表4 相对技术关联度矩阵(相对技术相似度矩阵)

字段:德温特手工代码V01⁃A02A1AL03⁃B01A2V01⁃A02A5BV01⁃A02A5A...L02⁃A02L02⁃G07DV01⁃A02A1A1.00000.01920.01210.0145...0.00020.0015L03⁃B01A20.69411.00000.37880.3060...0.00250.0858V01⁃A02A5B0.37650.32561.00000.1598...0.00090.0258V01⁃A02A5A0.21180.12410.07541.0000...0.00090.0170V01⁃A02A10.18820.12340.11210.1333...0.00070.0182A12⁃E100.14120.15960.13110.0803...0.00180.0103S03⁃B01F0.12940.14650.04700.2522...0.00010.0194V01⁃A02A7A0.12940.05410.02580.0948...0.00000.0015V01⁃A04K10.12940.15240.13450.2602...0.00200.0264X12⁃D01B0.10590.01400.00640.0161...0.00130.0348A08⁃M09A0.07060.06810.08220.0096...0.00120.0012A09⁃A030.07060.07000.08480.0096...0.00110.0027A12⁃E07C0.07060.11430.09430.0602...0.00360.0330V01⁃B03A30.07060.00520.00270.0024...0.00490.0018E35⁃K040.05880.00780.00270.0016...0.00750.0121L02⁃A020.05880.02050.00870.0177...1.00000.0476L02⁃G07D0.05880.09220.03220.0450...0.00621.0000

表5 技术领域之间的距离

字段:德温特手工代码V01⁃A02A1AL03⁃B01A2V01⁃A02A5BV01⁃A02A5A...L02⁃A02L02⁃G07DV01⁃A02A1A0.00001.28671.61141.7738...1.94101.9397L03⁃B01A21.28670.00001.29561.5699...1.97701.8221V01⁃A02A5B1.61141.29560.00001.7648...1.99041.9420V01⁃A02A5A1.77381.56991.76480.0000...1.98151.9381V01⁃A02A11.78591.26331.40891.5981...1.97181.8847A12⁃E101.85841.82211.85601.9159...1.99641.9884S03⁃B01F1.86871.77721.93201.6946...1.99941.9698V01⁃A02A7A1.84711.59201.82931.6536...1.99781.9878V01⁃A04K11.86241.50091.60261.4998...1.96101.9092X12⁃D01B1.88991.96561.98551.9745...1.98361.9107A08⁃M09A1.92911.91981.90521.9897...1.99701.9986A09⁃A031.92921.92271.90751.9900...1.99791.9970A12⁃E07C1.92941.88221.90321.9390...1.99541.9659V01⁃B03A31.92331.97861.99021.9945...1.86731.9921E35⁃K041.94041.98851.99631.9981...1.96261.9817L02⁃A021.94101.97701.99041.9815...0.00001.9463L02⁃G07D1.93971.82211.94201.9381...1.94630.0000

由表5可以看出,在上述17个领域(226 975条专利技术)组成的技术网络当中,两两技术领域相对距离最近的是:A08-M09A与A09-A03,两个技术领域之间的距离为0.753 3。相对距离为2的技术领域表示两者没有关联,如V01-B03A3与S03-B01F、E35-K04与V01-A02A7A。在以上153个距离中,所有相对距离的均值和方差分别为1.675 5和0.384。

同理,笔者可根据杰卡德相似公式和表3数据,计算得出杰卡德距离矩阵,如表6所示。

表6 技术领域间的杰卡德距离矩阵

字段:德温特手工代码V01⁃A02A1AL03⁃B01A2V01⁃A02A5BV01⁃A02A5A...L02⁃A02L02⁃G07DV01⁃A02A1A1.0000...L03⁃B01A20.98091.0000...V01⁃A02A5B0.98810.78771.0000...V01⁃A02A5A0.98630.90320.94601.0000...V01⁃A02A10.97670.88550.90010.9022...A12⁃E100.99960.98330.98810.9964...S03⁃B01F0.99820.94720.98530.9541...V01⁃A02A7A0.97970.95080.97760.9261...V01⁃A04K10.99230.88160.90230.8573...X12⁃D01B0.99590.99160.99640.9940...A08⁃M09A0.99970.98960.98900.9993...A09⁃A030.99980.99330.99290.9996...A12⁃E07C0.99990.99660.99760.9993...V01⁃B03A30.99440.99600.99810.9987...E35⁃K040.99920.99750.99920.9997...L02⁃A020.99980.99780.99920.9992...1.0000L02⁃G07D0.99850.95350.98550.9875...0.99451.0000

由于杰卡德相似系数矩阵是对称矩阵,所以以下三角矩阵即可表示全部距离。由表6可以看出,在17个领域组成的技术网络中,两两技术领域相对距离最近的是:A08-M09A与A09-A03,两者之间的距离为0.590 208 138,这与笔者利用公式计算得出的结果相一致。另外,笔者还可以计算出所有数据(153个杰卡德距离)的均值和方差为0.983 4和0.002。相比之下,杰卡德距离的均值较大,但方差很小。由此可以看出,杰卡德在度量技术领域之间的距离时,没有利用相对技术关联度或相似度计算出来的数据结果显著。

图3是利用表6数据绘制的V01-A02A1A与17个技术领域之间的杰卡德距离曲线图。图4是根据表5数据绘制的V01-A02A1A与17个技术领域之间的距离。从中可以看出,随着共类专利个数的减少,V01-A02A1A与每个领域之间的距离在平缓增加。

图3 V01-A02A1A与17个技术领域之间的杰卡德距离

4 多个技术类别之间的相似度与距离度量

以上是17个德温特手工代码技术相似度和距离之间的度量,那么单独一个代码分类与其它所有技术领域关联度呈何种关系呢?本文利用“MAN=(V01-A02A1A AND (L03-B01A2 OR V01-A02A5B OR V01-A02A5A OR V01-A02A1 OR A12-E10 OR S03-B01F OR V01-A02A7A OR V01-A04K1 OR X12-D01B OR A08-M09A OR A09-A03 OR A12-E07C OR V01-B03A3 OR E35-K04 OR L02-A02 OR L02-G07D ))”进行高级检索,可得到V01-A02A1A类别与其它所有技术领域共类专利的总数。同理,可检索出17个分类分别在网络中共类的专利个数,并可计算出每个专利代码在17个技术网络中的杰卡德技术相似系数和技术关联度。表7是以杰卡德系数及利用公式(1)、公式(2)计算出的技术关联度(技术相似系数)。

图4 依据表5计算出的V01-A02A1A与17个技术领域之间的距离

表7 每个手工代码在技术网络中的技术关联度

字段:德温特手工代码与其它所有代码共类技术个数本技术类别所含专利总数本技术网络所含专利总数本领域与整体杰卡德相似系数本领域与总体网络技术关联度V01⁃A02A1A77852269750.0003392320.905882353L03⁃B01A2202730712269750.008889610.660045588V01⁃A02A5B149126402269750.0065359190.564772727V01⁃A02A5A91412452269750.0040210110.734136546V01⁃A02A15506182269750.0024224490.889967638A12⁃E10839267372269750.0033178710.031379736S03⁃B01F110059032269750.0047459210.186345926V01⁃A02A7A4254692269750.001872090.906183369V01⁃A04K187413502269750.0038425860.647407407X12⁃D01B36321132269750.0015870590.171793658A08⁃M09A13929172282269750.0604888090.808509403A09⁃A0314660293052269750.0606737850.500255929A12⁃E07C61921000002269750.0193027690.06192V01⁃B03A32359862269750.0010319420.238336714E35⁃K0443564362269750.0018671450.067588564L02⁃A02640254892269750.0025414580.02510887L02⁃G07D66633002269750.0029005830.201818182方差:0.0003679410.113958906

由表7可见,A09-A03的杰卡德相似系数为0.060 7,与本技术网络的相似度(融入度)最高,但实际上,其只有约50%的专利技术与本技术网络存在共类关系。而有91%共类关系的V01-A02A7A,其杰卡德相似系数为0.001 9,在本技术网络中排名第13位,这显然是不合适的。所以,笔者认为,杰卡德系数在分析技术类别共类关系方面可选择性不强。

由表7可以看出,L02-A02在17个技术类别组成的技术网络中融入程度最小,只有0.025的关联度。而V01-A02A7A的融入程度最高,技术关联度为0.906。A09-A03在17个领域组成的技术网络中,其技术关联度(技术相似度)为0.500 255 929,意味着有一半以上的专利与其它领域技术存在共类现象。

同理,可根据公式(1)、公式(2)检索并计算出2005-2015年每种德温特手工代码在17个代码组成的技术领域中的技术关联度,如表8所示。

表8 2005-2015年每种手工代码技术关联度

字段:德温特手工代码20052006200720082009201020112012201320142015V01-A02A1A0.83331.00000.87500.66671.00001.00001.00001.00001.00001.00001.0000L03-B01A20.82350.80950.79830.83900.92630.84620.86670.83130.85390.92750.9565V01-A02A5B0.56570.61040.69700.66150.76420.81160.83080.85060.71550.82930.7857V01-A02A5A0.77420.85000.90910.79690.84380.82610.82500.88710.91670.98460.9677V01-A02A10.90000.79490.93330.83331.00001.00001.00001.00001.00001.00001.0000A12-E100.16810.19200.11690.17860.19060.20940.21050.21840.18430.19180.1522S03-B01F0.25690.21180.14380.11670.18000.12920.12700.12190.12270.11520.0973V01-A02A7A0.96670.91430.93750.35711.00001.00001.00001.00001.00001.00001.0000V01-A04K10.81480.69700.69570.69640.72220.66350.60200.72130.70290.74470.5616X12-D01B0.07220.13920.08820.17460.16220.22220.11290.13510.08510.04350.0000A08-M09A0.79190.80820.83720.71190.73550.87320.81220.81770.76860.67630.6921A09-A030.62260.56210.54010.58300.74070.74430.61730.67890.63950.67760.6658A12-E07C0.03340.03900.02700.05170.05810.08180.07810.07660.07300.07900.0716V01-B03A30.27270.26920.24170.11540.29410.20930.35190.41180.33330.41380.5200E35-K040.06060.11560.10440.03670.04270.05910.04780.05590.02330.02150.0474L02-A020.04370.06680.05930.04240.02150.03070.02810.03680.02050.02190.0282L02-G07D0.45000.20000.15380.42860.51020.62300.62960.60270.57330.66670.6333

根据表8,本文绘制了图5。

图5 2005-2015年每种手工代码的技术关联度

由图5可以看出,每个技术类别在网络中的关联度变动情况基本不大(其中包括每年的数据和1963-2015的合计数据),但有个别技术类别在整个技术网络中的地位波动相对较大。例如:V01-A02A5B(POSITIVE TEMPERATURE COEFFICIENT即具有正温度系数(PTC)效应的聚合物材料)、V01-B03A3和L02-G07D波动较大;V01-B03A3(MANUFACTURE OF DIELECTRIC MATERIAL非传导性电介质材料生产技术)在整个技术网络中的地位每年都在上升;L02-G07D(RESISTIVE OXIDE COMPOSITIONS,SEMICONDUCTIVE OXIDE COMPOSITIONS)2009年以后,其在整个技术网络中的地位基本稳定在0.6左右,表明其在整个技术网络中的地位有所提升。

关于杰卡德系数矩阵度量的技术领域之间的距离,由图6可以看出,A08-M09A和A09-A03波动最大,而且呈下降趋势,与图5进行比较,并不能得出同样的结果。之所以出现这种变化,一方面是由于技术领域本身在整个技术网络中的地位有所改变;另一方面是由于杰卡德系数分子较大,本领域技术在整个技术领域专利中所占比例较大,所以本领域技术数量稍有变化就会导致杰卡德相似系数的巨大变化,才会出现上述分析结果。因此,直接运用杰卡德系数度量技术类别之间的共类分析并不合适。

图6 2005-2015年每种手工代码在17个代码组成网络中的杰卡德相似系数

与杰卡德标准化进行对比,改进后的杰卡德标准化数据方差远远小于杰卡德相似系数,这就为评估技术领域之间的相似度和关联度提供了更加有力的工具。随着两大技术领域关联度或相似度增加至一定程度,应该划分出一个新的技术领域和新技术分类代码,并为专利技术分类提供依据。

5 结语

本文根据专利共类关系进行技术关联度分析,能够反映技术类别之间的关联程度,但共类分析也有明显不足之处,即共类程度高低并不能对单个技术的核心度进行很好的评价或评估。如笔者对MAN=(V01 A02A1A AND L03 B01A2 AND V01 A02A5B AND V01 A02A5A AND V01 A02A1)时进行检索,只检索到1条记录,虽然这条记录被归为多个类别,但其并不能被定为核心技术。又如,JP2012153536-A专利并未施引专利,但其却被归为E12-A08、E34-D03C、L03-B01A2等17个德温特手工代码分类,被引频次为75的专利WO2005052959-A2却只被归为12个德温特手工代码中。

参考文献:

[1] NARIN F.Patent bibliometrics[J].Scientometrics,1994,30(1):147-155.

[2] NARIN F,CARPENTER M P,WOOLF P.Technological performance assessments based on patents and patent citations[J].IEEE Transactions on Engineering Management,1984,31(4):172 - 183.

[3] MEYER M S.Patent citation analysis in a novel field of technology:an exploration of nano-science and nano-technology[J].Scientometrics,2001,51(1):163-183.

[4] TIJSSEN R J W,BUTER R K,LEEUWEN T N V.Technological relevance of science:an assessment of citation linkages between patents and research papers[J].Scientometrics,2000,47(2):389-412.

[5] LI X,CHEN H,HUANG Z,et al.Patent citation network in nanotechnology (1976-2004)[J].Journal of Nanoparticle Research,2007,9(3):337-352.

[6] BARIRANI A,AGARD B,BEAUDRY C.Discovering and assessing fields of expertise in nanomedicine: a patent co-citation network perspective[J].Scientometrics,2013,94(3):1111-1136.

[7] RODRIGUEZ A,KIM B,TURKOZ M,et al.New multi-stage similarity measure for calculation of pairwise patent similarity in a patent citation network[J].Scientometrics,2015,103(2):565-581.

[8] HYUNSEOK PARK, JANGHYEOK YOON. Assessing coreness and intermediarity of technology sectors using patent co-classification analysis: the case of Korean national R&D[J].Scientometrics,2014(982).

[9] CHUNJUAN LUAN,ZEYUAN LIU,XIANWEN WANG.Divergence and convergence: technology-relatedness evolution in solar energy industry[J].Scientometrics,2013(972).

[10] ENGELSMAN E C,VAN RAAN A F J.A patent-based cartography of technology[J].Research Policy,1994,23(1): 1-26.

[11] MCCAIN K W.The structure of biotechnology R & D[J].Scientometrics,1995,32(2):153-175.

[12] LEYDESDORFF L.Patent classifications as indicators of intellectual organization[C]//Journal of the American Society for Information Science & Technology,2008:1582-1597.

[13] PARK H,YOON J.Assessing coreness and intermediarity of technology sectors using patent co-classification analysis: the case of Korean national R&D[J].Scientometrics,2014,98(2):853-890.

[14] FREEMAN L C.A set of measures of centrality based on betweenness[J].Sociometry,1977,40(1):35-41.

[15] LIM H,PARK Y.Identification of technological knowledge intermediaries[J].Scientometrics,2010,84(3):543-561(19).

[16] MCNAMEE R C.Can′t see the forest for the leaves: similarity and distance measures for hierarchical taxonomies with a patent classification example[J].Research Policy,2013,42(4):855-873.

[17] OECD.The measurement of scientific and technological activities: using patent data as science and technology indicators[EB/OL].Paris: OECD.Retrieved November 13,at http://www.oecd.org/dataoecd/33/62/2095942.pdf,1994.[18] SI H J,KIM Y.Measuring relatedness between technological fields[J].Scientometrics,2010,83(2):435-454.

[19] LEIPONEN A,BAR T.A measure of technological distance[J].Economics Letters,2012,116(3):457-459.

[20] LETEN B,BELDERBOS R,VAN LOOY B.Technological diversification,coherence,and performance of firms[J].Journal of Product Innovation Management,2007,24(6):1-27.[21] YOON B,PARK Y.A text-mining-based patent network: analytical tool for high-technology trend[J].Journal of High Technology Management Research,2004(15):37-50.

[22] ChANG P L,WU C C,LEU H J.Using patent analyses to monitor the technological trends in an emerging field of technology: a case of carbon nanotube field emission display[J].Scientometrics,2010,82(1):5-19.

[23] 王贤文,刘则渊,侯海燕.基于专利共被引的企业技术发展与技术竞争分析:以世界500强中的工业企业为例[J].科研管理,2010,31(4):127-138.

[24] LEYDESDORFF L.On the normalization and visualization of author co-citation data: Salton's cosine versus the Jaccard index[J].Journal of the American Society for Information Science & Technology,2008,59(1):77-85.

[25] HAMERS L,HEMERYCK Y,HERWEYERS G,et al.Similarity measures in scientometric research: the jaccard index versus salton's cosine formula[J].Information Processing & Management,1989,25(89):315-318.

[26] ROUSSEAU R.Jaccard similarity leads to the marczewski-steinhaus topology for information retrieval[J].Information Processing & Management,1998,34(97):87-94(8).

[27] LEVANDOWSKY M,WINTER D.Distance between sets[J].Nature,1971(234):234.34-35.

[28] WANG X,ZHANG X,XU S.Patent co-citation networks of fortune 500 companies[J].Scientometrics,2011,88(3):761-770.

[29] 栾春娟.战略性新兴产业共性技术测度指标实证研究[J].中国科技论坛,2012(6):73-77.

[30] SMALL H.Co-citation in the scientific literature: a new measure of the relationship between two documents[J].Journal of the American Society for Information Science,1973,24(4):265-269.

(责任编辑:王敬敏)

Relative Technical Correlation Research based on the Field of TechnologyA Case Study on Co-classification Analysis of Derwent Patent Manual Code

Li Yonggan

(Henan Intellectual Property Affairs Center, Zhengzhou 450008,China)

Abstract:This paper reviewed the analysis of network structure of technology, determination of core technology and the emergence of new technology, the methods of technology integration and diffusion, analyzed co-occurrence analysis standardization tools of the past scientometrics and patentometrics, according to the use of Jaccard similarity coefficient in the patentometrics, puts forward the concept of relative technological correlation and relative technological similarity, to improve the previous Jaccard Distance and Jaccard similarity coefficient, using Derwent patent manual code in the database to makes an empirical analysis, and made a comparison analysis with Jaccard similarity coefficient.

Key Words:Relative Technological Correlation; Jaccard Similarity Coefficient; Derwent Patent Manual Code; Co-Classification Analysis

收稿日期:2016-09-23

基金项目:河南省软科学项目(162400410088)

作者简介:李勇敢(1977-),男,河南开封人,河南省知识产权事务中心工程师,研究方向为技术创新与知识产权。

DOI:10.6049/kjjbydc.2016060800

中图分类号:G301

文献标识码:A

文章编号:1001-7348(2017)07-0146-08