专利态势报告提供了特定技术在全球范围内的专利情况,可为政策讨论、战略研究规划或技术转让提供参考。本报告不仅提供了对生成式人工智能专利情况的全面和最新理解,还提供了对其未来应用和潜在影响的见解。本报告旨在帮助创新者、研究人员和组织机构驾驭快速发展的生成式人工智能领域,抓住合作、伙伴关系和发展机遇。
全球生成式人工智能发明的数量
过去几年中,生成式人工智能的兴起主要受到三个因素的推动:更强大的计算机、作为训练数据来源的大型数据集的获取,以及人工智能/机器学习算法的改进。大型语言模型中的变换器架构等发展,极大地推动了生成式人工智能的进步。这使在许多不同领域开发复杂应用成为可能。
生成式人工智能的技术进步体现在专利活动的急剧增加方面。在过去10年中,生成式人工智能的专利族数量从2014年的仅733项增长到2023年的14000多项。自2017年引入变换器(支持已成为生成式人工智能代名词的大型语言模型的深度神经网络架构)以来,生成式人工智能专利数量增长了800%以上。同期发表的科学出版物数量增幅更大,从2014年的116份增加到2023年的34,000多份。仅在2023年就有超过25%的生成式人工智能专利和超过45%的生成式人工智能科学论文发表。
哪些机构在生成式人工智能领域拥有最多专利?
- 腾讯
- 平安保险集团
- 百度
腾讯、平安保险集团和百度拥有最多生成式人工智能专利。腾讯计划在微信等产品中加入生成式人工智能功能,以改善用户体验。平安专注于用于承保和风险评估的生成式人工智能模型。百度是生成式人工智能领域的早期参与者之一,最近发布了最新的基于大型语言模型(LLM)的人工智能聊天机器人ERNIE4.0。中国科学院(排名第4位)是排名前十的唯一研究机构。阿里巴巴(排名第六)和字节跳动(排名第9位)为进入前10名的其他中国公司。
IBM(排名第5位)、Alphabet/谷歌(排名第8位)和微软(排名第10位)是在生成式人工智能专利方面排名前列的美国公司。IBM开发了一个生成式人工智能平台——watsonx,使公司能够部署和定制大型语言模型,重点关注数据安全性和合规性。Alphabet/Google的人工智能部门DeepMind最近发布了最新的大型语言模型Gemini,该模型正在逐步集成到Alphabet/Google的产品和服务中。微软是生成式人工智能的另一个重要参与者,也是OpenAI的投资者。OpenAI最近才申请了第一批生成式人工智能专利。排名前十的还有韩国电子企业集团三星电子(排名第7位)。
哪些机构发表的有关生成式人工智能的科学出版物数量最多?
自2010年以来,中国科学院发表了1100多份科学出版物,在科学出版物发表数量方面遥遥领先。接下来为清华大学和斯坦福大学,各自发表了600多份出版物。Alphabet/谷歌(排名第4位)是唯一一家进入前20名的公司(556份科学出版物)。
然而,如果以引用次数来衡量科学出版物的影响力,公司则占据主导地位。Alphabet/Google以较大优势作为领先机构,另有七家公司进入前20名。OpenAI的情况也值得注意。在我们的生成式人工智能科学出版物语料库中,该公司仅发表了48份出版物(按出版物数量排名第325位),但这些出版物却获得了来自其他科学出版物的11,816次引用(总排名第13位)。
哪里的生成式人工智能技术发明最多?
- 中国
- 美利坚合众国
- 大韩民国
- 日本
- 印度
- 联合王国
- 德国
根据专利公布的发明人地址,2014年至2023年间,总部位于中国的发明人贡献了38000多个专利族。自2017年以来,中国每年在该领域公布的专利数量超过了其他所有国家的总和。
2014年至2023年期间,美利坚合众国提供了约6,300个专利族,是生成式人工智能专利申请的第二大重要研究地。亚洲国家大韩民国、日本和印度是生成式人工智能的其他重要研究地,均位居全球前5位(分别为第3、第4和第5位)。联合王国在欧洲领先(全球第6位),在同一时期公布了714项专利。不过,德国紧随其后(708项专利族),其近年来公布的生成式人工智能专利数量超过了联合王国。
在与生成式人工智能相关的全球专利申请活动中,这些排在前列的发明人所在地占绝大多数(94%)。
哪种生成式人工智能模型拥有最多专利?
近年来,人们开发了许多生成式人工智能程序或模型。其中最重要的生成式人工智能程序有:
- 生成式对抗网络(GAN);
- 基于解码器的大型语言模型(LLM);
- 变分自编码器(VAE);
- 扩散模型。
不过,根据专利摘要、权利要求书或标题中提供的现有信息,并非所有生成式人工智能专利都能归入这五个特定的核心模型。
在这些生成式人工智能模型中,大多数专利属于生成式对抗网络。2014年至2023年期间,该模型类别的专利族共有9700项,仅2023年就公布了2400项此类专利族。变分自编码器和大型语言模型的专利数量分别排名第2位和第3位,2014年至2023年期间分别新增约1800个和1300个专利族。
就专利增长而言,过去十年中,生成式对抗网络专利的增长最为强劲。不过,最近增长速度有所放缓。相比之下,扩散模型和大型语言模型在过去三年中的增长率要高得多,扩散模型的专利族数量从2020年的18个增加到2023年的441个,大型语言模型的专利族数量从2020年的53个增加到2023年的881个。由ChatGPT等现代聊天机器人引发的生成式人工智能热潮显然提高了对大型语言模型的研究兴趣。
生成式人工智能专利中使用的主要数据类型有哪些?
生成式人工智能的主要数据类型包括:
- 图片
- 视频
- 文本
- 语音
- 声音
- 音乐
在不同的生成式人工智能模式或数据输入输出类型中,大多数专利属于图像/视频类。图像/视频数据对于生成式对抗网络尤为重要。涉及文本和语音/声音/音乐处理的专利为大型语言模型的关键数据类型。其余模式包括三维图像模型、化学分子/基因/蛋白质和代码/软件,迄今为止,这些模式的专利数量要少得多。与有关生成式人工智能核心模型的专利一样,有些专利无法明确归入特定的数据类型。此外,由于某些生成式人工智能模型(如多模态大型语言模型(MLLM))克服了只能使用一种类型的数据输入或输出的限制,有些专利被归入一种以上模式。
生成式人工智能专利的主要应用领域
生成式人工智能专利的主要应用领域包括:
- 软件;
- 生命科学;
- 文档管理;
- 商业解决方案;
- 制造;
- 交通运输;
- 安全;
- 电信
随着生成式人工智能逐步进入产品、服务和流程领域,必将对许多行业产生重大影响,成为内容创作和提高生产率的技术推动力。
例如,在生命科学和文档管理与出版领域,出现了许多生成式人工智能专利(2014年至2023年间,在这两个领域分别有5346项和4976项相关专利族)。其他值得注意的应用领域包括商业解决方案、工业和制造业、交通运输、安全和电信,在同一时期,这些领域的生成式人工智能专利数量从约2,000项到约5,000项不等。
在生命科学领域,生成式人工智能可以通过筛选和设计用于新药配方和个性化药品的分子来加快药物开发。在文档管理和出版领域,生成式人工智能可以实现任务自动化,以节省时间和金钱,并创建量身定制的营销材料。在商业解决方案领域,生成式人工智能可用于客户服务聊天机器人、零售协助系统和员工知识检索。在工业和制造业领域,生成式人工智能可实现产品设计优化和数字孪生编程等新功能。在交通运输领域,生成式人工智能在自动驾驶和公共交通优化方面发挥着至关重要的作用。
生成式人工智能可以帮助设计新分子,加快药物开发。它可以实现文档管理和出版任务的自动化,用于企业的零售辅助系统和客户服务聊天机器人,实现新产品设计和优化,包括在公共交通系统和自动驾驶领域。