It is found that the patent layout of AIGC emerging enterprises in the United States focuses on technical fields such as electrical digital data processing, graphic data reading and presentation. Patent layout is analyzed by knowledge width, knowledge depth, knowledge cohesion, knowledge fragment level and knowledge consistency clustering. Through this meticulous study, a profound understanding of the patent layout is achieved, leading to the identification of three distinct categories: professional players, technology giants and leaders, and innovators. Professional players refer to AIGC companies that have a focused and specialized patent layout, indicating a deep understanding and expertise in specific technical fields. Technology giants and leaders are AIGC enterprises that have established themselves as industry leaders, with a patent layout that reflects their dominance and influence in the field. Innovators are AIGC startups that demonstrate a unique and novel approach in their patent layout, showcasing their ability to introduce new ideas and technologies to the AIGC industry. These categories provide invaluable insights into the diverse strategies implemented by the aforementioned enterprises.
Furthermore, an in-depth exploration of the patent core knowledge areas and bridging knowledge areas is conducted, ultimately revealing the focal points of knowledge and the areas of expertise within AIGC companies. Core knowledge refers to the essential and fundamental knowledge areas that are central to the patent layout of AIGC enterprises. These knowledge areas represent the key technical fields in which the companies focus their patent filings. Bridging knowledge areas, on the other hand, are the knowledge areas that connect or bridge different technical fields within the patent layout of AIGC enterprises. These areas indicate the interdisciplinary nature of the companies' patent filings and their ability to integrate knowledge from multiple domains. The identification of core knowledge areas and bridging knowledge areas helps in understanding the strategic focus and innovation capabilities of AIGC companies, as well as the potential for cross-pollination of ideas and technologies across different technical fields.
The paper's pivotal contribution lies within its empirical analysis of the patent layout, which presents a wealth of valuable insights into the intricate clustering patterns and specialized knowledge areas of the leading enterprises in the field of AIGC. Firstly, it provides empirical insights into the patent layout of leading AIGC enterprises. Secondly, it employs complex network analysis methods and K-means clustering algorithms in machine learning to examine the patent IPC network of AIGC companies, offering a novel approach to investigating their patent layouts. Thirdly, it categorizes the patent layout for AIGC enterprises into three distinct groups: professional players, technology giants and leaders, and innovators. These categories are determined based on factors such as knowledge width, depth, cohesion, fragment level, and consistency clustering. Fourthly, it identifies the core knowledge areas and bridging knowledge areas within the patent layouts of AIGC companies, thereby shedding light on their technical focus, interdisciplinary integration, and innovation capabilities.
In summary, this analysis of the layout of patent networks for companies specializing in AIGC encompass enables a comprehensive understanding of the technical focus and specialization of AIGC companies based on the arrangement of their patents. Then it allows for the identification of prominent industry players and technology leaders within the AIGC sector based on the structure of their patent layouts, and facilitates an assessment of the innovation capabilities and novel approaches employed by AIGC companies, as reflected in their patent layouts. Furthermore, this analysis suggests policy measures for the development of the AIGC industry in China, with a specific focus on algorithm, computing power, and data.
2022年11月,OpenAI公司发布ChatGPT,在全球范围内引起广泛关注和讨论。ChatGPT仅用2个月就实现用户数量过亿,而此前用户破亿最快的是抖音(TikTok),用时9个月。ChatGPT具有强大的对话能力和生成能力,能够为用户提供各种主题的相关信息和答案,是生成式人工智能(Artificial Intelligence Generated Contents, AIGC)在文本领域的实际应用。
AIGC是指通过人工智能生成内容,即用户输入一段文字,AIGC能够给出相应回答,包括文本、图像、音频、视频、代码等。AIGC技术的核心是利用深度学习模型,实现内容创造、跨模态融合等[1]。
从产业层面来看,AIGC产业具有鲜明的科学驱动(Science-Based)和技术驱动(Technology-Based)特征。专利作为知识和技术的重要载体,在AIGC领域有着举足轻重的作用。作为科技创新型企业,AIGC公司普遍以专利、版权手段为核心,积极布局,综合利用多种方式保护其知识产权[2]。现有专利布局研究主要包括技术领域分析、专利地图绘制、专利申请及许可策略等,对AIGC领先企业专利布局的研究亟待深入。
世界各国及主要经济体都在人工智能方面作出重大战略部署。美国拥有全球最多的AI初创企业,占全球AI初创公司的40.6%;中国紧随其后,占18.2%[3]。伴随着AIGC技术和产品的井喷式发展,人工智能作为引领未来的战略性技术,在新一轮科技革命和产业变革中再次成为重要驱动力量。然而,目前有关AIGC的研究大多从技术本身、发展历程、制度规制等方面进行阐述[4-6],对于AIGC产业进行实证分析的研究较少。因此,针对领先AIGC企业专利布局的分析有待加强,以助力本土企业及时洞悉领先企业技术专利战略,为我国制定AIGC产业政策提供重要参考。
本文选取18家美国主要AIGC领先企业的专利布局进行分析,通过构建基于国际专利分类表(International Patent Classification, IPC)的专利布局网络,利用复杂网络分析方法对领先企业专利知识领域进行研究,基于专利布局知识深度、宽度、紧密程度、分离程度等指标,识别各企业核心知识领域和桥接知识领域。其次,通过机器学习的K均值(K-means)聚类算法对企业专利布局进行分类比较,进一步挖掘专利内在价值,分析和总结不同类型AIGC企业,全面刻画美国AIGC领先企业的技术版图,为我国AIGC行业的技术创新和深入发展提供启示。
生成式人工智能(AIGC)是指依靠AI大模型和AI算力训练生成内容(中国信通院,2022),即AI通过对数据分析进行再创作,进而生成新数据,比如一篇文章、一幅画、一段视频等。因此,AIGC不只是依靠AI分担或辅助工作,而是一种全新的创作或生产方式,即人工智能在大模型技术加持下,通过独立学习和大量训练,实现对多模态内容的理解和认知[4]。
尽管AIGC大多由初创公司进行开发,但依然需要科技巨头和风险投资基金的深度参与。绝大部分AIGC公司都与学术界联系紧密,主要由初创公司和学术型公司构成中坚力量,由科技巨头进行投资。以目前公认的AIGC领域领先的3家实验室OpenAI、DeepMind和FAIR为例,3家公司都属于纯AI研究实验室,背后分别倚靠微软、谷歌和Meta(Facebook)3家科技巨头,合作方式无一例外地是科技巨头提供数据、软硬件和资金等支持,3家公司则负责开发人工智能算法等应用层技术。
与国外科技巨头投资初创公司的模式不同,中国国内的AIGC项目大多由大型科技公司自行研发并搭建自己的AI生态系统。如腾讯、百度等科技公司,都基于自身技术优势,开展AIGC技术研究。腾讯的AI实验室基础研究方向包括计算机视觉、语音技术、自然语言处理和机器学习,使用场景包括游戏、数字人、内容和社交AI等,技术成果已被微信、QQ、QQ音乐等上百个腾讯产品使用。百度作为国内首先投入AI研发的企业,率先推出覆盖全场景的大模型——文心大模型,包括自然语言处理、视觉、跨模态和生物计算四大行业模型。华为的HiAI能力开放平台则充分发挥自身硬件优势,搭建了包含芯片能力、应用能力和服务能力于一体的智能生态系统。
具体来说,AIGC项目由三大部分构成,即算据、算力和算法[4],如图1所示。从合作方式来看,大多是由科技巨头提供算据和算力,初创公司提供算法。具体包括:第一,算据。AIGC的学习和创作能力是基于大量数据,由机器学习和模拟生成。巨量算据需要持续的时间投入,这恰是科技巨头的强项,而初创公司很难具有这样的数据积累。第二,算力。算力包括硬件和软件两个方面,硬件如GPU、内存等,软件包括云计算服务平台等。第三,算法。人工智能领域的算法、模型等核心技术是AIGC实现突破的关键,包括自然语言理解、神经网络、多模态融合等技术。在AIGC项目中,算法大都由初创公司研发。这些初创公司通常拥有业界顶尖的技术专家,一些企业具有深厚的研发和学术背景,对前沿技术有着深刻的认识和感知。
图1 AIGC技术构成及合作模式
Fig. 1 AIGC technology composition and firm cooperation model
大多数科技公司都会通过申请专利保护自己的核心技术,AIGC领先企业和科技巨头也不例外。我国在AI领域的专利数量超过美国,但整体上美国的进展更加迅猛,产品发布也很稳健。从ChatGPT的表现来看,我国的AIGC发展与美国仍然有一定差距,原因有如下几点:一是从专利申请主体看,美国的人工智能专利以企业申请为主,尤其是独角兽公司和学术型企业,因而技术创新更能满足市场需求。我国则以高校申请为主,导致技术创新缺乏与市场的有机结合[7]。二是从基础科学和技术合作两个方面来看,我国在人工智能领域的基础科学发展方面处于领先地位,其中,论文发表数量占据优势,但在技术创新方面表现不佳(朱桂龙等,2019)。三是在人工智能相关的核心技术专利中,中国拥有的智能芯片技术专利数量最多,而美国拥有最多的自然语言处理技术[8]。具体来说,我国的人工智能专利以应用型技术为主,例如计算机视觉和语音识别等,无法支撑大语言模型开发;而美国的人工智能专利以基础型技术为主,如神经网络和深度学习等,这些基础技术可以用于构建大语言模型。因此,从专利着手,分析和探寻美国在AIGC领域的技术布局,有助于更好地了解我国与美国在AIGC领域的差距。
通过专利研究,有助于了解技术创新发展趋势、专利布局特征以及演变规律[9-10]。目前,基于专利进行关键核心技术识别和预测的方式主要包括:
(1)利用专利注册信息,例如申请人、申请量、专利类型等量化指标对前沿技术进行预测[11]。
(2)基于专利题目、摘要等具体内容,利用文本挖掘、语义识别等方法对前沿技术进行分析 [12]。
(3)基于专利引用数据,通过构建专利间引用网络,利用网络分析等方法,对核心技术进行判断和预测[13]。
(4)利用专利IPC分类等,对技术主题和关键技术涉及的知识领域进行分析。针对专利IPC的研究主要涵盖以下方面:第一,运用IPC分类号对技术主题进行分析。第二,利用IPC分类号出现频次判断领域关键技术。若某IPC分类号在技术专利中出现频次较高,说明该技术类别极有可能是该领域基础技术或关键技术。例如毛云莹、陆伟[14]提出基于IPC关联的专利技术和产业双向分析框架,对领域内技术与产业进行关联;向姝璇等[15]利用IPC号组合相似度,对企业潜在竞争对手进行挖掘。第三,利用IPC号构建专利知识组合网络,不仅有助于识别关键核心技术,而且能够分析一国或地区在该技术领域内的专利战略和技术政策[16]。Bueno等[17]利用该方法对生物能源行业进行研究,通过构建生物能源行业的IPC合作网络,对行业前沿技术进行预测;王钦等(2022)通过构建专利组合网络图,分析5G产业的IPC技术分布。
总体来看,现有文献为本研究提供了坚实基础,但尚存在进一步探索空间:第一,目前研究多集中在新能源汽车、物联网、生物能源等相对成熟的高科技产业,对AIGC专利的分析较少。第二,有关我国人工智能的专利研究多集中于国家或省域层面,对国外领先企业专利布局的深入分析较少。特别是缺乏深入企业内部,挖掘专利间知识关联性并对比不同企业专利布局的研究。
本文数据来自德温特专利数据库(Derwent Innovations Index,DII)。德温特数据库是文摘索引型数据库,提供了自1963年以来的专利文献信息,包括专利摘要、发明人、申请人、权利人、摘要、引用信息和IPC等。
本文对于领先公司的选取,主要参考《全球AIGC市场预测2022—2028年:基于公司、地区、类型和应用》(Global AIGC Market 2022 by Company, Regions, Type and Application, Forecast to 2028)[18],《人工智能生成艺术的技术开发和商业化》(AI-generated Art's Technology Development &Commercialisation)[19]等相关产业报告,选择14家从事AIGC技术的美国著名中小型企业,以及在AIGC领域投入巨大且卓有成效的4家大公司,如微软、谷歌和脸书(Meta)等致力于AIGC技术的大型IT公司,以及提供算力硬件的企业Nvidia。OpenAI未被纳入是因为其是非营利性企业,并且该公司不发表论文和申请专利。样本企业如表1所示。
表1 AIGC样本企业基本情况
Table 1 Basic information of AIGC sample enterprises
企业成立年份主要产品相关领域Appen1996MatrixGoAI数据标注平台,高品质智能语音识别技术Automated Insights2007Wordsmith自然语言生成平台,将原始数据自动转换为有深度、有个性并且像人类写手那样生成风格多变的叙事文章Ayasdi2008依托拓扑数据分析技术的解决方案供应商基于TDA技术,运用人工智能、机器学习等方法,帮助客户提升公司运营效率并降低成本Brighter-ion2000数据分析软件为向服务提供商、金融机构、医疗保健机构支付费用的人和商家提供企业AI应用程序,进行欺诈检测Cogito2007声音和情绪识别服务帮助企业的客户服务中心和呼叫中心改善客户体验;为医疗保健供应商提供情绪识别服务Datagrid2017提供AI产品和解决方案,产品有kitemiru ,INAI MODELKitemiru:虚拟试穿的服务,只需用户上传照片,AI可立即生成并显示产品试穿图像INAI MODEL:将AI生成的数字人类形象生成广告,无需模特和拍摄工作,降低内容制作成本DeepMind2010AlphaGo,MuZero,AlphaC-ode,SparrowAlphaGo:围棋AI程序MuZero:AI算法,在没有学习游戏规则的情况下,能下围棋和国际象棋AlphaCode:计算机程序编写AISparrow:AI聊天机器人Facebook(META)2004FAIR人工智能研究所DeepFace:AI人脸识别Memory Networks:在深度学习中加入长期记忆以构建自然语言问答系统DeepText:阅读文本的人工智能引擎Gaussian2013智能清洁机器人与无人驾驶环卫车通过AI算法实现机器人的精准定位建图、实时更新动态地图、自动规划清洁路径、感知识别环境及垃圾污渍、灵活绕避障碍物Google1998LaMDA, BardLaMDA:对话应用程序的语言模型,能够进行流畅、多回合对话式AI模型Bard :能够进行生成式 AI 协作,能够完成创造性任务,例如撰写电子邮件等,目前处于试验期Ipsoft1996认知机器人Amelia能够建模并响应用户需求,提供对话、表达、情感和理解等互动,加深客户联系,提升商业价值LogMeIn2003GoTo基于人工智能的安全可靠的远程接入软件Microsoft1975Microsoft Designer,Microsoft Bing,Azuren Microsoft Designer: 图像AIGC,选择单词组合以查看 AI 生成的图像Microsoft Bing:文本AIGC,输入问题,获得答案,GPT3Azure OpenAI service:提供人工智能云端服务,是GPT-4的唯一云供应商Narrative Science2010Quill对结构化数据进行分析,转化为智能且富有洞察力的自然语言Nvidia1993借助基于 GPU、DPU 和 CPU 三种新一代架构构建的 NVIDIA HPU加速计算平台和数据中心Hopper GPU架构:扩展数据中心的各种工作负载,加速计算Grace CPU 架构: 提供高性能、节能高效和高带宽的连接,加速大型AI、HPC、云和超大规模工作负载BlueField DPU 架构:通过对各种高级网络、存储和安全服务进行卸载、加速以及隔离,为云端、数据中心或边缘计算等工作负载提供安全、加速的基础设施Persado2012文本生成AI为每位客户提供交流的个性化文本,用于促销的电子邮件、社交媒体广告等,提升营销效果,提高品牌参与度和转化率Textio2014文本检验AI人工智能文本检验平台,通过机器阅读与文本分析,帮助用户预测文书内容未来效果及其成功的可能性Yseop2008Augmented Analyst将数据转换为报告和专业知识,利用自然语言 (NLG) 自动编写报告
利用IPC分类判断专利涉及的知识领域。IPC根据专利所属领域,提供完整且齐全的分类指标。本研究根据2023年3月世界知识产权组织更新的IPC目录识别相应知识领域。
如果某专利涉及多个IPC,则认为企业在研发该成果时能够联系不同领域知识,整合多个领域知识,即这些知识领域之间存在联系[20],据此展现企业专利布局,并反映企业在AIGC技术应用中的知识内容及彼此联系。不同企业涉及的知识领域、拥有的网络结构都不同。通过复杂网络分析方法,对不同企业专利布局网络进行分析、对比和总结,有助于识别不同AIGC独角兽公司的知识构成、知识宽度和知识深度等不同特征。
(1)数据准备:根据样本企业名称,在德温特数据库中查询企业专利信息并进行下载。作为用于对比的大型企业,其专利数量较多,故本文根据AI、AIGC等关键词筛选专利并下载。数据包括具有唯一识别性的专利号、IPC代码和其它相关元数据。将IPC代码标准化为特定版本(IPC-2013),以确保数据集一致。此次共获得AIGC相关专利859个,涉及796个IPC知识领域。
(2)网络构建:使用共现分析法,通过链接、共享一个或多个IPC代码专利构建IPC网络。基于18家企业专利及其相关IPC,对每个样本企业构建专利*IPC的二模矩阵,利用UCINET将矩阵转为IPC共现的一模矩阵。同时,为进行对比,生成一个包含所有专利IPC的整体网络。
(3)复杂网络分析:对于生成的网络,使用Gephi与UCINET网络分析工具进行可视化和网络分析。具体指标如下:
专利布局知识宽度(width):使用IPC网络规模测量,规模越大,表示企业专利涉及的知识领域越宽泛[21]。
专利布局知识深度(depth):表示企业专利在特定知识领域的集中程度,使用网络中心势(network centralization)测量[22]。该指标值越大,表示企业专利越集中在某特定的IPC知识领域,企业对该知识领域越了解。具体计算公式如下:
(1)
其中,Cmax表示观测网络中心度最高节点的连接数,Ci为其它节点的连接数,n为网络规模。
知识领域紧密程度(cohesion):是指企业专利知识联系的紧密程度,数值越大,表示企业越能够在不同知识领域间建立联系。本文使用平均聚集系数进行测量。聚集系数(Clustering Coefficient)用于测量网络中三元闭包(triadic closure)概率,网络聚集系数是所有行动者邻域密度的平均值[23]。具体计算公式如下:
(2)
其中,G表示网络中闭合的三角形个数,ki为网络中所有非闭合的三角形数量。
知识领域分离程度(fragment):用Girven-Newman算法中的模块度(modularity)进行测量。通过计算,网络被分割为不同模块或社区。具有高模块性的网络,其社区结构明显,且各社区节点之间连接紧密,但社区间关系稀疏[24]。具体计算公式如下:
(3)
其中,Ci和Cj分别表示节点i与j所属社区,如果两个节点同属一个社区,则δ(Ci,Cj)=1。
此外,测量企业IPC网络中各节点(知识领域)的中心位置,以确定专利布局的核心知识领域和桥接知识领域。通过比较核心知识领域与桥接知识领域的一致性,构建企业知识一致性(concurrency)程度。该指标反映企业专利战略是聚焦于某知识领域,还是基于不同领域的知识整合。
核心知识领域使用特征向量中心性(eigenvector centrality)进行测量,该指标反映网络节点影响力和网络位置,具体以节点直接联系数量表征,同时考虑相邻节点的重要性。通过迭代计算,如果某节点被许多节点指向(这些节点也具有较高的特征向量中心性),那么该节点具有较高的特征向量中心性[25]。其计算公式如下:
(4)
其中,i是被测量节点,M是直接相邻的节点集合,Xt是其邻近点的向量中心性。
桥接知识领域使用中介中心性(betweenness centrality)测量,反映该节点经过网络中其它两个节点最短路径的频率[26]。中介中心性高的知识领域连接着更多不同知识领域,这种知识桥接特性使得其可能成为下一个创新点[27]。其计算公式如下:
(5)
其中,i是被测量节点,j和k是其它节点,bjk(i)是连接j、k且经过i的路径数量。
(4)K均值聚类。根据以上指标,对18家样本企业进行聚类分析,总结其专利布局。具体方法是使用机器学习中的K均值(K-means)聚类算法,其通过迭代提供局部最优聚类结果[28]。在最优聚类数量k选择方面,首先进行10次聚类计算,k依次从1递增至10。根据所有结果的组内平方和(within sum of squares, WSS)、eta系数(η2 coefficient)和误差减少比例系数(proportional reduction of error, PRE)进行判断,其中,后两个系数根据WSS计算得出[29]。使用软件Stata 17.0,聚类迭代次数设置为10万次。
图2展示了18家企业知识领域构成网络,其中,网络节点代表具体的IPC分类,边代表两个IPC分类间存在联系。节点越大,表示与其连接的IPC领域越多。本网络共涉及796个IPC领域、6 005条边,平均每个IPC领域与15个IPC领域连接,网络密度为0.019,较为稀疏,按照Girven-Newman算法,可以分成50个子网络,以不同色度标注。本文共标出10个连接数最高的IPC领域,主要涉及G06F、G06K、G06N、H04L,表明美国人工智能企业的专利布局主要集中在电数字数据处理、图形数据读取和呈现、数据载体标记和传送、基于特定计算模型的计算机系统、数字信息的传输等知识领域。
图2 18家美国AIGC企业专利的IPC网络
Fig.2 IPC network of 18 leading AIGC enterprises in the United States
表2列出18家公司专利网络的基本统计指标。可以看出,边数量变化趋势与专利数量基本一致。平均点度反映每个IPC领域与其它领域的连接数,其中,最高的为Cogito公司(14.63),最低的为Guassian公司(2.06);网络直径(diameter)反映网络中最长的测地线距离(geodesic distance),数值越大表示网络中可达的知识领域距离较远,其中,Google公司的网络直径最长(7),Appen等4家企业的直径最短(2);网络密度测量联系的紧密程度,但受网络规模影响,不同企业网络规模差异较大,不可直接比较,这里仅列出作为参考。
表2 18家美国AIGC企业专利的IPC网络指标
Table 2 Basic indicators of IPC network of 18 leading AIGC enterprises in the United States
企业名称专利数量网络中边的数量平均点度网络直径网络密度Appen2133.71420.619Automated Insights7677.88220.493Ayasdi3341512.38830.188Brighterion641886.83640.127Cogito1939514.6330.276Datagrid8555.520.289DeepMind3301 44012.30840.053Facebook2342112.56740.19Gaussian69692.0640.031Google3578210.49770.071Ipsoft6867.81830.372LogMein475418.94250.075Microsoft623407.47350.083Narrative Science7342211.56240.161Nvidia511 11211.95750.065Persado530530.455Textion313510.820.45Yseop13192.37530.158所有企业8586 00515.08860.019
表3给出18家企业专利布局指标。在知识宽度方面,涉及知识领域最多的是DeepMind,相关知识领域达到234个,Appen涉及的知识领域最少,只有7个。在知识深度方面,最高的依然是DeepMind,其76.5%的专利涉及计算模型结构;集中度最低的是Gaussian公司,其涉及的知识领域仅占所有领域的4.6%,主要为风力驱动。在知识紧密度方面,最高的是Textio公司,其紧密度为0.97,意味着几乎所有连接都存在闭合,即所有知识领域都互相连接。紧密程度最低的为Brighterion公司,仅为0.162,即知识领域呈现A-B-C连接,仅为16.2%存在A-C闭合,换而言之,其专利布局网络结构较为开放(open)。在知识分离程度上,分离度最高的为Gaussian公司,达到0.867,表示其知识领域非常分散,整个网络可分成若干子网络。知识分离度最低的是Appen公司,仅有0.107,表示其绝大部分专利涉及的领域存在相互联系,可以归为一个子网络。
表3 18家美国AIGC企业专利布局指标
Table 3 Analysis indicators of patent layout of 18 leading AIGC enterprises in the United States
企业知识宽度知识深度专利集中领域知识紧密程度知识分离程度Appen70.533G06F-017/27 (电数字数据处理自动分析,例如语法分析)0.9240.107Automated Insights170.575G06F-017/27(电数字数据处理自动分析,例如语法分析)0.8930.159Ayasdi670.681G06F-017/30(电数字数据处理信息检索及其数据库结构)0.870.257Brighterion550.426G06Q-020/40(金融或管理系统中支付人授权、审核和批准)0.1620.386Cogito540.654G10L-025/63(语音识别及情感状态估计)0.8970.462Datagrid200.205G06F-008/65(可变固态存储器技术)0.9480.355DeepMind2340.765G06N-003/04(基于特定计算模型的计算机系统结构)0.860.274Facebook670.319G06N-003/063(基于特定计算模型的计算机系统)0.8320.48Gaussian670.046F03D-009/00(特殊用途的风力发动机;风力发动机与受它驱动装置的组合)0.7560.867Google1490.243G06N-020/00(机器学习)0.9080.71Ipsoft220.324G06F-017/27(电数字数据处理自动分析,例如语法分析)0.8890.458LogMeIn1210.568H04L-029/06(数字信息传输协议)0.8870.527Microsoft910.29G06F-017/30(电数字数据处理信息检索及其数据库结构)0.8750.527Narrative Science730.435G06F-040/56(自然语言生成)0.7730.442Nvidia1860.443G06N-003/08(基于特定计算模型的计算机系统学习方法)0.8930.546Persado120.545G06Q-030/02(市场研究、分析、价格评估的数据处理系统和方法)0.90.178Textio250.371G06F-016/31(数据结构、储存结构)0.970.289Yseop160.2G06F-040/56(自然语言生成)0.7490.57
根据向量中心性计算结果,得到各公司专利布局的3个核心知识领域,具体见表4。这些领域在IPC整体网络中位于中心,也是企业现阶段最为关注的知识领域。总体来看,核心知识领域集中在G06大类,主要涉及计算、推算、计数等方面,其子类涉及信息传递、计算模型等,具体包括数据、程序模型、机器学习、自然语言处理、图像识别等领域。但各公司的核心知识领域不同,例如Datagrid的核心知识领域主要集中在数据传输、储存和分析等方面;Narrative Science则集中在自然语言处理技术方面。
表4 18家美国AIGC企业核心知识领域
Table 4 Core knowledge areas of 18 leading AIGC enterprises in the United States
企业核心知识领域的Top3(向量中心性取值)具体知识领域AppenG06F-017/27 (1) G06F-015/16 (0.869) G06F-017/00 (0.869)电数字数据处理自动分析、多计算组合、数据处理方法Automated InsightsG06F-017/27 (1) G06F-017/21 (0.938) G06F-017/24 (0.938)电数字数据处理自动分析;文本处理;编辑、删除技术AyasdiG06F-017/30 (1) G06F-016/28 (0.891) G06T-011/20 (0.874)电数字数据处理信息检索;关系或对象数据库;绘图技术BrighterionG06Q-020/40 (1) G06N-020/00 (0.956) G06N-005/04 (0.675)金融或管理系统中支付人授权、审核和批准;机器学习;计算推理方法或设备CogitoG10L-025/63 (1) H04L-029/08 (0.795) G06Q-030/02 (0.783)语音识别及情感状态估计;数字信息传输控制规程;市场研究、分析、价格评估的数据处理系统和方法DatagridG06F-008/65 (1) G06F-008/658 (1) H04L-012/24 (1)可变固态存储器技术;电数字数据处理增量更新;数字信息传输维护、管理装置DeepMindG06N-003/04 (1) G06N-003/08 (0.977) G06K-009/62 (0.632)基于特定计算模型的计算机系统结构、学习方法;数据识别电子设备FacebookG06N-003/063 (1) G06F-009/50 (0.999) G06F-013/40 (0.955)基于特定计算模型的计算机系统;电数字数据处理资源分配、总线结构GaussianF21S-008/00 (1) F21V-023/00 (1) F21V-029/00 (1)特殊用途的风力发动机、风力发动机与受它驱动装置的组合;照明装置电路原件布置、冷却或加热装置GoogleH04L-012/28 (1) H04L-029/08 (0.992) H04L-012/741 (0.922)LAN局域网或WAN广域网;数字信息传输控制规程、路由地址处理IpsoftG06F-017/27 (1) G06F-017/30 (0.834) G10L-015/18 (0.834)电数字数据处理自动分析;信息检索及数据库结构;语音和音频自然语言模型LogMeinH04L-029/06 (1) H04L-029/08 (0.645) H04M-001/725 (0.509)数字信息传输协议;数字信息传输控制规程;无线电话机MicrosoftG06F-017/30 (1) G06F-009/44 (0.798) G06F-015/18 (0.787)电数字数据处理信息检索及其数据库结构、执行专门软件程序的装置、学习机器Narrative ScienceG06F-017/27 (1) G06F-040/56 (0.986) G06F-040/20 (0.896)语法分析;自然语言生成、分析NvidiaG06N-003/08 (1) G06N-003/04 (0.951) G06V-010/82 (0.619)基于特定计算模型的计算机系统学习方法、体系结构;神经网络PersadoG06Q-030/02 (1) G06Q-030/00 (0.889) G06F-017/27 (0.866)市场研究、分析、价格评估的数据处理系统和方法;电子商务;电数字数据处理自动分析(如语法分析)TextionG06F-016/31 (1) G06F-017/24 (1) G06E-001/00 (0.924)数据结构、储存结构;电数字数据处理系统编辑技术;光学计算处理数字数据设备YseopG06F-040/56 (1) G06F-016/9035 (0.730) G06F-040/35 (0.730)自然语言生成;电数字附加数据过滤、话语或对话表示
根据中介中心性计算结果,得到各公司专利布局分值最高的3个桥接知识领域,具体见表5。其中,黑体标出的是未在核心知识领域(表4)中出现的知识领域,这类领域连接不同知识,是未来创新的可能爆发点。在由企业知识领域构成的网络中,计算系统体系结构、学习方法(G06N-003/04、G06N-003/08)、数字信息传输协议、控制规程(H04L-029/06、H04L-029/08)、数据识别和表示(G06K-009/62)是排名前五的桥接知识领域,意味着AIGC领域中连接不同知识领域的是通用技术。
表5 18家美国AIGC企业桥接知识领域
Table 5 Bridging knowledge areas of 18 leading AIGC enterprises in the United States
企业桥接知识领域的Top3(中介中心性取值)具体知识领域AppenG06F-017/27 (0.533)*电数字数据处理自动分析,例如语法分析Automated InsightsG06F-017/27 (0.411) G06F-017/28 (0.058) G06F-017/21 (0.044)电数字数据处理自动分析、编辑、删除技术;自然语言处理转换AyasdiG06F-017/30 (1) G06T-011/20 (0.874) G06F-019/00(0.850)电数字数据处理信息检索及其数据库结构、数字计算或数据处理方法;绘图技术BrighterionG06Q-020/40 (0.372) G06N-020/00 (0.278) G06N-003/04 (0.201)金融或管理系统中支付人的授权、审核和批准;机器学习;计算模型体系结构CogitoG10L-025/63 (0.461) H04L-029/08(0.073) H04L-029/06(0.047)语音识别及情感状态估计;数字信息传输控制规程、协议DatagridG06F-008/65 (0.007) G06F-008/658 (0.007) H04L-012/24 (0.007)可变固态存储器技术;电数字数据处理增量更新;数字信息传输维护、管理装置
续表5 18家美国AIGC企业桥接知识领域
Table 5(Continued) Bridging knowledge areas of 18 leading AIGC enterprises in the United States
注:取值为0的未列入表内;黑体加粗表示该领域未在向量中心性表5中出现
企业桥接知识领域的Top3(中介中心性取值)具体知识领域DeepMindG06N-003/04 (0.366) G06N-003/08 (0.331) G06K-009/62 (0.070)基于特定计算模型的计算机系统结构、学习方法;数据识别电子设备FacebookG06N-020/00(0.187) G06N-003/063 (0.149)H04L-029/08(0.133)机器学习;基于特定计算模型的计算机系统;数字信息传输控制规程GaussianH04N-007/18(0.005)C23C-024/10(0.004)H04N-005/225(0.004)图像通信闭路电视系统、电视摄像机;金属材料镀覆液相GoogleG06N-020/00 (0.314) H04L-029/08 (0.185)G06F-015/173(0.166)机器学习;数字信息传输控制规程;电数字数据处理互连网络IpsoftG10L-021/00〛(0.466) G06F-017/27 (0.333)H04M-003/493(0.063)语言信号转换为视觉或触觉信号;电数字数据处理自动分析;通信交互信息业务LogMeinH04L-029/06 (0.432)G06F-017/27(0.077) H04L-029/08 (0.061)数字信息传输协议;电数字数据自动分析;数字信息传输控制规程MicrosoftG06F-017/30 (0.173) G06F-015/18 (0.146)G06F-015/16(0.125)电数字数据处理信息检索及其数据库结构、多计算组合;学习机器Narrative ScienceG06F-040/56 (0.247) G06F-017/27 (0.239) G06F-040/20 (0.089)自然语言分析、生成;语法分析NvidiaG06N-003/08 (0.244) G06N-003/04 (0.229)G06K-009/00(0.107)基于特定计算模型的计算机系统学习方法、体系结构;文本、图形识别PersadoG06Q-030/02 (0.490) G06F-017/27 (0.181) G06Q-030/00 (0.054)市场研究、分析、价格评估的数据处理系统和方法;电数字数据处理自动分析(如语法分析);电子商务TextionG06F-016/31 (0.117) G06F-017/24 (0.117)数据结构、储存结构;电数字数据处理系统编辑技术YseopG06F-040/56 (0.114)G06F-040/30(0.095)G06F-017/28(0.047)自然语言生成;语义分析;自然语言处理或转换
根据K均值算法计算,组内方差、WSS及相关系数判断如图3所示,可以看到,在k=3时,WSS、log(WSS)、eta系数分布图存在一个明显拐点,eta系数表示WSS减少约30%, PRE在k=3时也达到最小值。因此,最优的聚类组数应该是3。
图 3 10次K均值聚类结果的WSS及其相应系数分布
Fig. 3 WSS and corresponding coefficient distribution of the results of 10 times of K-means clustering
当k=3时,5个维度上的18家企业得分与K均值聚类矩阵结果如图4所示。可以发现,所有变量经过标准化处理后,x轴和y轴的取值范围都为(-2,2)。矩阵中的数字点代表企业在横轴和纵轴上的取值,具体数字代表企业所属聚类。其中,核心、桥接知识差异表示表4、表5中各企业向量中心性和中介中心性排名前三的知识领域不一致数量。
图4 18家美国AIGC企业的K均值聚类得分情况(k=3)
Fig. 4 K-means clustering scores of 18 leading AIGC enterprises in the United States (k=3)
进一步将18家AIGC公司的聚类结果和聚类组内专利布局指标均值进行汇总。有研究根据商业模式对AI公司进行分类,具有较强直观性和现实意义。例如可以分为AI产品/服务提供商、人工智能专业开发商、数据分析提供商和创新技术研究商[30]。根据聚类结果并参照以往研究,本文将18家企业的专利布局分为三类,具体见表6。
表6 18家美国AIGC企业的k均值算法聚类结果(k=3)
Table 6 Clustering results of K-means algorithm for 18 leading AIGC enterprises in the United States (k=3)
聚类序号企业名称企业数量聚类内专利布局指标均值宽度深度紧密度分离程度不一致度1 专业玩家Automated Insights、Datagrid、Narrative Science、Persado、Textion629.400.420.890.2802 大厂/先行者Brighterion、DeepMind、Facebook、Gaussian、Google、LogMein、Microsoft、Nvidia8109.550.360.760.541.333创新者Appen、Ayasdi、Cogito、Ipsoft437.500.540.890.321.50
(1)专业玩家,如聚类1所示,这类企业的知识宽度最小,知识深度中等,知识联系紧密,而且各领域间分离程度较低,核心知识与桥接知识基本完全一致。这些企业专注于AIGC的特定技术及产品,资源较集中,成立时间也较短,创始人多为某领域技术专家,企业专利也集中在该领域。例如,Narrative Science公司于2010年由西北大学两位教授成立于芝加哥,公司技术聚焦于将企业海量数据自动转换为拟人化文本输出。
(2)大厂/先行者,如聚类2所示,本文选择对比的4家大型企业全部属于该聚类,这类企业知识宽度最广,但深度最小,知识领域之间的紧密度较低,拥有比较明显的子网络,核心知识与桥接知识存在不一致性。这些企业多是传统的IT、硬件巨头,成立时间较长,主营产品虽然不是人工智能领域,但资源充足,较早广泛地布局AIGC领域且投入多年,因此专利知识领域较为分散。主要专利策略为防御性策略,或者避免在AIGC领域出现不可预料的挑战者。例如,谷歌公司布局人工智能,投资DeepMind公司;微软公司投资OpenAI公司,并签订独家云供应商协议,微软的必应搜索引擎接入GTP3;Nvida除涉及传统CPU、GPU等硬件设备外,也积极布局云分析业务。
(3)创新者,如聚类3所示,这些企业知识宽度适中,知识深度最大,专利布局聚焦于少数特定领域,同时,知识连接紧密,分离程度中等,核心知识与桥接知识显著不一致,说明除聚焦的知识领域外,专利布局中连接了不同领域知识,属于公司技术突破和业务扩展方向。例如,Ayasdi公司主要聚焦于拓扑数据分析技术解决方案,但其业务涉及金融、医疗、政务等多个行业,通过人工智能总结不同行业的大数据要点并提供优化建议,其专利布局则以数据处理与提取为主,并涉及不同行业知识领域。
为了更好地展现聚类中代表性企业的专利布局,选择3家企业进行IPC网络可视化,如图5所示。其中,节点代表IPC分类,边代表IPC分类在同一个专利中存在共现关系。节点越大,表示该知识领域与其它领域联系越多;边越粗,表示两个领域的共现关系越显著。不同色度表示不同子网络,根据Girven-Newman算法可以得出,三类企业的知识领域网络存在明显差异。如Automated Insights属于新创企业,主要产品为Wordsmith,产品功能比较单一,主要是将原始数据转为人类风格多变的深度文章,其专利围绕语法分析等展开,知识宽度较小。Google则是最早布局AIGC的大企业,其知识宽度较大,主要涉及计算、信号装置、信息传输、外科诊断(G06、G08B、H04L、A61B)等多个知识领域,并且明显分成多个子网络,各子网络间存在桥接知识领域联系。Cogito公司的子网络较少,但是知识领域间联系较紧密,其初始业务是利用AIGC为各大公司客户服务中心提供支持,如识别客户语音、音量、语调和停顿等,其核心知识也集中在语音识别领域(G10L)。2018年其基于该领域服务催生新业务,如使用AIGC提供医疗情绪识别服务,知识领域扩展至信息传输(H04)等新领域。
图5 各聚类代表性企业专利布局
Fig. 5 Patent layout of representative enterprises in each cluster
本文研究了18家美国AIGC企业的专利布局,构建了专利IPC网络,并结合复杂网络分析方法和K均值聚类算法,从知识宽度、知识深度、知识紧密度、知识分离程度和知识一致性程度对专利布局进行聚类。研究发现:①美国领先企业的专利布局主要集中在电子数字数据处理领域,并强调不同模态数据转换,以此为核心,扩展相关技术至不同行业,体现了AIGC技术的通用性;②领先企业的专利布局在知识深度、宽度、紧密度、分离度和一致性程度上都存在差异,与企业业务存在较高相关性,体现了美国AIGC产业多样化的技术路径;③通过算法,这些企业可以鲜明地分为三类,即专业玩家、大厂/领先者和创新者,他们分别在产业中承担不同角色。如专业玩家长期聚焦于特定技术发展,有效衔接基础研究环节与应用研究环节;大厂/领先者知识宽度最大,知识领域涉及不同行业,提升了AIGC的通用性;创新者知识深度最大,除聚焦特定技术外,亦涉及少数新行业,拓展了AIGC技术应用深度。这意味着AIGC产业发展具有不同性质的企业,对技术的研发、应用和扩展具有重要意义。
在研究方法上本文采取K均值聚类算法,为专利价值识别与信息检索提供了可靠依据,有助于提供新洞见、改进预测精度和增强数据理解力。具体来说,第一,该算法可以对复杂的专利数据进行降维,如K均值聚类可将专利布局分成不同簇,使相似企业归为一组,促使专利布局更易于理解,从而有助于识别与特定领域或技术相关的核心企业,感知领域发展趋势、技术创新水平和竞争场域。第二,K均值聚类算法有助于整理和分类专利,通过将相似的专利布局归为一组,发现布局内在结构和关联性。这种发现可以启发研究人员探索新方法、新思路和新路径,从而在创新领域提出新洞见。
基于以上发现,通过对比中美两国AIGC产业发展,对我国AIGC产业发展提出以下建议:
从企业层面来看,未来AIGC产业要取得长远发展,需要更多的“专业玩家”和“创新者”进行优势互补,共同建立AIGC发展生态,形成良性循环。我国的AIGC发展由腾讯、百度、阿里巴巴、华为等大型科技公司主导,“大厂”的优势在于资金和算据,但“大厂”的传统业务并不是AI领域,因此在核心优势和技术深度方面存在一定不足。通过对百度、华为等国内企业IPC专利布局的分析发现,国内企业的专利布局多集中在G06N3/04和08等领域,即机器学习方法和体系结构、电子识别等领域;囤积的专利数量较多,但商业化应用较少,特别是缺乏专业应用的企业。相比之下,作为“专业玩家”和“创新者”的初创公司则在算法方面具有天然优势,而各类算法技术也为AIGC应用提供了底层支撑。相比美国AIGC企业的多样化发展,我国AIGC企业则显得模式较为单一。
从国家层面来看,不同产业拥有不同创新能力演化机制[31]。要促进AIGC产业发展,我国需充分发挥新型举国体制优势:结合产业特性,首先是加大人工智能基础建设,为AIGC产业发展提供保障;其次是重点培养“大厂/先行者”,培育行业领军企业,带动产业整体发展[32]。在基础建设方面,我国可以从算力、算法和数据3个方面入手,发展人工智能产业,创新云计算、大数据、超算等技术,提升计算机算力;推进人工智能算法研究和开发,培养一批高水平的人工智能算法研究人员和开发人员,加强人工智能算法创新和应用;建设更加完善的数据基础设施,提高数据质量和管理水平。在培养“大厂/先行者”方面,可以向人工智能企业提供税收减免、研究拨款等财政支持;实施强有力的法律法规,保护AIGC公司的知识产权;鼓励开放式创新,通过创建网络、建立合作关系和开展其它形式的合作,不断拓展企业知识深度、广度和紧密度。
因为数据和方法所限,本文还存在一些不足,希望未来能够进一步完善:一是本文样本企业仅包含美国AIGC领域的领先企业,未来可以进一步对比不同区域企业的专利布局;二是专利蕴含丰富的信息,未来研究可以进一步挖掘如引文、摘要、发明合作等专利信息,拓展对AIGC产业领域的认识。
[1] LIU J, YANG H, LI Q. Coverless image steganography based on neural style transfer[C]. Fourteenth International Conference on Digital Image Processing, 2022, 12342: 870-878.
[2] RAMALHO A. Intellectual property protection for AI-generated creations: Europe, United States, Australia and Japan [M].London:Routledge, 2021.
[3] VAN ROY V, VERTESY D, DAMIOLI G. AI and robotics innovation: a sectoral and geographical mapping using patent data[R].GLO Discussion Paper, 2019.
[4] 李白杨, 白云, 詹希旎,等. 人工智能生成内容(AIGC)的技术特征与形态演进 [J].图书情报知识, 2023,40(1): 66-74.
[5] 王友发, 张茗源, 罗建强,等. 专利视角下人工智能领域技术机会分析[J].科技进步与对策, 2020, 37(4):19-26.
[6] 周贞云, 邱均平. 面向人工智能的我国知识图谱研究的分布特点与发展趋势 [J].情报科学, 2022, 40(1): 184-192.
[7] 王山, 陈昌兵. 中美人工智能技术创新的动态比较——基于人工智能技术创新大数据的多S曲线模型分析 [J].北京工业大学学报(社会科学版), 2023, 23(3): 54-67.
[8] 袁野, 吴超楠, 李秋莹. 人工智能产业核心技术的国际竞争态势分析 [J].中国电子科学研究院学报, 2020, 15(11): 1128-1138.
[9] GARZANITI N, TEKIC Z, KUKOLJ D, et al. Review of technology trends in new space missions using a patent analytics approach [J].Progress in Aerospace Sciences, 2021, 125: 100727.
[10] CHOI Y, PARK S, LEE S. Identifying emerging technologies to envision a future innovation ecosystem: a machine learning approach to patent data [J].Scientometrics, 2021, 126: 5431-5476.
[11] 乔永忠, 姚清晨. 中国授权不同性质专利技术领域布局实证研究[J].科技进步与对策, 2015, 32(24):16-20.
[12] LI X, WU Y, CHENG H, et al. Identifying technology opportunity using SAO semantic mining and outlier detection method: a case of triboelectric nanogenerator technology [J].Technological Forecasting and Social Change, 2023, 189: 122353.
[13] 王伟光, 余景年, 彭莉. 中国工业机器人产业技术研究——专利地图视角[J].科技进步与对策, 2017, 34(7): 55-61.
[14] 毛云莹, 陆伟. 基于IPC关联的专利技术和产业双向分析框架研究 [J].情报科学, 2022, 40(4): 33-39.
[15] 向姝璇, 李睿. 基于专利文献整体相似度计算的竞争对手发现——以5G领域为例 [J].情报理论与实践, 2021, 44(5): 100-105.
[16] CHO T S, SHIH H Y. Patent citation network analysis of core and emerging technologies in Taiwan: 1997-2008 [J].Scientometrics, 2011, 89(3): 795-811.
[17] BUENO C D S, SILVEIRA J M F J D, BUAINAIN A M, et al. Applying an IPC network to identify the bioenergy technological frontier [J].Revista Brasileira de Inovacao, 2022, 17: 259-286.
[18] GLOBAL INFO RESEARCH. Global AIGC market 2022 by company, regions, type and application, forecast to 2028[R/OL].https://marketpublishers.com/report/it-technology/other-ict-n-software/global-aigc-ai-generated-content-market-2022-by-company-regions-type-n-application-forecast-to-2028.html.
[19] BRIDGE T. AIGC series- AI-generated art's technology development &commercialisation[EB/OL].https://thirdbridge.com/transcripts/aigc-series-ai-generated-arts-technology-development-commercialisation.
[20] LEYDESDORFF L, KUSHNIR D, RAFOLS I. Interactive overlay maps for US patent (USPTO) data based on International Patent Classification (IPC) [J].Scientometrics, 2014, 98(3): 1583-1599.
[21] RESCH C, KOCK A. The influence of information depth and information breadth on brokers' idea newness in online maker communities [J].Research Policy, 2021, 50(8): 104142.
[22] TIRADO R, HERNANDO , AGUADED J I. The effect of centralization and cohesion on the social construction of knowledge in discussion forums [J].Interactive Learning Environments, 2015, 23(3): 293-316.
[23] GULER I, NERKAR A. The impact of global and local cohesion on innovation in the pharmaceutical industry [J].Strategic Management Journal, 2012, 33(5): 535-549.
[24] XIANG J, HU T, ZHANG Y, et al. Local modularity for community detection in complex networks [J].Physica A: Statistical Mechanics and Its Applications, 2016, 443: 451-459.
[25] BONACICH P. Some unique properties of eigenvector centrality [J].Social Networks, 2007, 29(4): 555-564.
[26] YANG Z, SHU C, GAO S, et al. The combined impact of direct and indirect ties on innovation: the moderating role of similarity in alliance subtypes [J].Journal of Product Innovation Management, 2022, 39(6): 847-870.
[27] BURT R S. Structural holes and good ideas [J].American Journal of Sociology, 2004, 110(2): 349-399.
[28] BURNEY S A, TARIQ H. K-means cluster analysis for image segmentation [J].International Journal of Computer Applications, 2014, 96(4): 1-8.
[29] MAKLES A. Stata tip 110:how to get the optimal k-means cluster solution [J].The Stata Journal, 2012, 12(2): 347-351.
[30] WEBER M, BEUTTER M, WEKING J, et al. AI startup business models: key characteristics and directions for entrepreneurship research[J].Business &Information Systems Engineering, 2022, 64(1): 91-109.
[31] 姚威, 胡顺顺. 知识转化视角下战略性新兴产业自主创新能力演化机制研究[J].科技进步与对策, 2020, 37(4): 62-69.
[32] 姜军, 武兰芬. 核心技术及关键产业演变研究——中国专利权人的美国发明专利分析[J].科技进步与对策, 2014, 31(22): 80-83.