著者: Kathy Van Der Herten氏、製品管理ディレクター、CAS (米国化学会の一部門)、アントワープ、ベルギー
研究開発 (R&D) への投資は過去最高の水準に達しています。2022年の世界全体の研究開発投資額は推定2兆4,760億米ドルに達し、特許出願件数の高い伸びが続いていることで、世界の特許エコシステム、とりわけ特許庁の負担は増大しています。特許出願の増加と複雑化は、特許付与の大幅な遅延につながる可能性があります。その結果、法的な不確実性が生じ、イノベーションの阻害、研究開発投資の抑制、国家経済の競争力の低下を招くおそれがあります。
日本の特許庁 (JPO) が実施した研究 (2018年) によると、同庁の審査官はその調査時間の30%を先行技術調査 (出願対象の発明が既知であることの証明) に費やし、10%をその理解に費やしていると推定されます。
出願の適時性を改善するために特許庁が採用している1つの方法が、人工知能 (AI) ソリューションを利用して、審査中の潜在的な先行技術の特定を支援することです。AIは、出願特許と既存特許、非特許文献のデータを比較して類似性を発見する人間の能力を素早く模倣し、審査官は先行技術を調査する際にそうした類似性をレビューすることができます。AIを利用しても、人間の審査官による調査結果のレビューは必要ですが、出願の70%超でレビュー時間が大幅に短縮する可能性があります。
AIは、出願特許と既存特許、非特許文献のデータを比較して類似性を発見する人間の能力を素早く模倣し、審査官は (中略) そうした類似性をレビューすることができます。
WIPOのデータをもとに、米国化学会の一部門であるCASは、5大特許庁の特許出願件数が2012年から2021年にかけて年平均4.4%増加したと推定しています。出願件数の増加に加えて、特許の複雑性も高まっており、このことは1特許当たりのクレーム数、1つのクレームで引用される特許数、1特許当たりの先行技術引用数などの指標に見られます。
先行技術の調査は、複雑で時間のかかる反復プロセスです。各出願について、調査従事者と審査官は調査戦略を立て、使用するデータベースを選択し、調査を実施し、結果を評価し、必要に応じて他のパラメータを使用して調査を微調整して再度実行しなければなりません。
こうした調査は膨大な規模になります。欧州特許庁の調査 によると、包括的な特許出願の調査では、179のデータベースで約13億件の技術記録の先行技術調査が実施され、毎月の調査結果に表示される文書は約6億に上ります。
179のデータベースで約13億件の技術記録の先行技術調査が実施され、毎月の調査結果に表示される文書は約6億に上ります。
新技術の増加と特許出願の複雑化により、審査官は自身の技術分野における専門知識を絶えず向上させることが求められます。高度にキュレーションされた構造化データがあれば、AIが数百万のデータセットをふるいにかけ、出願対象との重複の可能性に関する参照情報を提供することで、特許審査プロセスを迅速化することが可能です。
多くの特許庁が特許出願の増加と複雑化の高まりに対応するために、人工知能 (AI) を活用したソリューションに注目しています。WIPOによると、現在27の国内特許庁で70を超えるAI関連のイニシアチブが進行しており、これには先行技術調査に焦点を当てた13の取り組みが含まれています。こうした取り組みは審査プロセス全体に対する完璧なソリューションではありませんが、審査時間の短縮を目的としており、審査の迅速化、ひいては顧客満足度の向上をもたらします。
例えば、カナダ知的財産庁は商業利用可能なAI検索エンジンを活用して、引用文献と出願特許、当該技術分野の現状との関連性を明らかにしています。日本の特許庁 (JPO) はAIを利用してファイルにインデックス付けし、関連する特許分類とキーワードを示し、関連性に応じて先行技術の特許文献のランク付けを行っています。また、米国特許商標庁 (USPTO) はAIを利用して特許性を判断し、過去の審査経過を分析し、USPTOのデータへのパブリック・アクセスを改善しています。
機械学習は、テキスト検索やインデックス付き用語の検索には有効ですが、組成物を含む特許に関しては有効性が低く、こうした特許ではしばしば化学構造内に重要なデータが含まれています。
最近、ブラジルの国立工業所有権機関 (Instituto Nacional da Propriedade Industrial、INPI) はCASと協力し、AIを活用したワークフロー最適化により化学分野の先行技術調査を加速させるプロジェクトを完了しました。化学分野の出願はブラジルINPIのバックログの約15%を占めていますが、非常に複雑で、特許文献と非特許文献についてテキストベースと化学構造ベースの検索が必要です。このソリューションでは、AIが4つのアルゴリズムの流れを統合し、さまざまなタイプの類似性などを解析して関連性の高い結果を得られるようにしました。
各アルゴリズムにはそれぞれ強みがあります。機械学習は、テキスト検索やインデックス付き用語の検索には有効ですが、(2つ以上の化合物が合成された) 組成物を含む特許に関しては有効性が低く、こうした特許ではしばしば化学構造内に重要なデータが含まれています。また、グラフ・データベースは機械学習が発見できない類似性と関連性を発見することができます。次に、4つの流れから生じた結果をアンサンブル・アルゴリズムで解析し、出願対象との重複の可能性が高い文献リストを生成しました。
生産性を大幅に向上
質の高いデータはAIアルゴリズムの学習にとってきわめて重要です。機械学習アルゴリズムがアクセスできるデータが多いほど、結果の重要性と確実性、信頼性は高まります。キュレーションされていない一般公開データの大半は、転記ミスや単位の誤表記、過度に複雑な特許用語などが含まれている可能性があり、いずれも調査の妨げとなります。これが特に問題となるのが化学とライフサイエンスの分野で、文献全体で物質の記述が統一されていなかったり、表や画像にキーワードが埋め込まれていたりします。科学者が収集し、構造化された形式で正規化され、処理され、結合されたデータを使用することで、情報の検索が容易になり、AIアルゴリズムの学習と先行技術調査のパフォーマンスが向上します。
データセットの学習は、技術や産業、出願によって異なる場合がありますが、AIの利用に対する基本的なアプローチは同じです。
ブラジルINPIのプロジェクトでは、主にCAS Content Collection™という世界最大の化学およびライフサイエンスのデータコレクションを利用し、これを抽出してインデックス付けし、結合することで、重要な情報に簡単にアクセスし、取得できるようにしました。さらに、アルゴリズム学習から特許を無作為に抽出し、結果とヒット率の正確性を測定するための制御セットとして使用しました。これらの特許を中国、日本、米国および欧州の特許庁の審査官が評価し、CASの知財調査専門家チームが妥当性を確認しました。
データセットの学習は、技術や産業、出願によって異なる場合がありますが、AIの利用に対する基本的なアプローチは同じです。どの技術分野でも、学習セットごとに、重複する引用文献として使用する文献を審査プロセスで特定します。化学などの非常に複雑な分野では、トピックを指定した学習セットのほうが有効ですが、他の分野では対象を絞った学習セットを使用してもあまり改善が見られない場合があります。その技術が一般的な学習セットに含まれている限り、多くの分野でモデルは有効に機能します。
ただし、データの質はきわめて重要です。
AIプロジェクト・チームには、対象分野に関する広範な専門知識が求められます。ブラジルINPIのプロジェクトでは、データ分析やワークフロー統合、高性能コンピューティング、科学調査などさまざまな分野の専門家と技術を組み合わせました。
チームのメンバーは、取り扱う課題と結果に関する分野横断的な専門知識が必要です。例えば、データサイエンスの知識があっても、化学構造の微妙な違いを理解していなければ、完全に有効なアルゴリズムを開発できない可能性があります。機械学習モデルを構築するコンピューター科学者は、化学データと化学構造も理解する必要があります。
ワークフロー統合も、特許庁の包括的ソリューションを構築する上で重要な分野です。レビューの過程で複数のシステムやフォルダに目を通して文献を発見しなければならない審査官は、ワークフローの改善と技術の向上により単一のダッシュボードが利用できるというメリットがあります。このダッシュボードでは、すべての出願書類と関係書類にアクセスし分析することができます。また、ある文献が引用される理由や結果の生成プロセスを知ることができ、審査手続に関する決定と内部品質レビューを記録するために必要なトレーサビリティが得られます。
特許庁の生産性と効率性、顧客サービスの劇的な改善は、審査官がAIなどの最新技術を活用したツールを使いこなすことで実現できます。イノベーションの加速に伴い、特許出願の増加と複雑化が予想されます。特許庁は引き続き、特許審査プロセスを最適化し、ひいてはサービス満足度の向上を求めるステークホルダーの期待に応えるための新しい方法が必要となるでしょう。
AIソリューションは、絶えず変化するこうした課題への取り組みを支援しますが、それでもなおカスタムメイドのアプローチを実行するには専門知識が必要です。特許庁のニーズはそれぞれ異なるため、画一的なアプローチは通用しません。特許庁の一般的な業務は同じですが、職員の数や各分野をサポートするために必要な技術は異なります。アルゴリズムによって共通のニーズを解決することは可能ですが、審査官がアルゴリズムのアウトプットをどう活用するかは、現在置かれている技術環境によって大きく異なる可能性があります。
特許庁の生産性と効率性、顧客サービスの劇的な改善は、審査官がAIなどの最新技術を活用したツールを使いこなすことで実現できます。
戦略的成果の実現を目指す特許庁は、リソースの制約がある中でステークホルダーの期待に応える、カスタマイズされたイノベーションが必要となるでしょう。データと技術、人間の専門知識を最適に組み合わせることで、将来に向けた持続可能な改善を支援するために必要な柔軟性が得られます。
AIによる世界の特許システムの生産性向上について、詳しくはCASのホワイトペーパー「国際特許システムの持続可能性への取り組み - 生産性向上におけるAIの役割」をご覧ください。
謝辞: Matthew Bryan氏およびAndras Jokuti氏、WIPO特許・技術部門 (Patents and Technology Sector) Bruno Poulequen氏、Ulrike Till氏およびYoung-Woo Yun氏、WIPOインフラ・プラットフォーム部門 (Infrastructure and Platforms Sector)
編集者: Catherine Jewell
WIPO Magazineは知的財産権およびWIPOの活動への一般の理解を広めることを意図しているもので、WIPOの公的文書ではありません。本書で用いられている表記および記述は、国・領土・地域もしくは当局の法的地位、または国・地域の境界に関してWIPOの見解を示すものではありません。本書は、WIPO加盟国またはWIPO事務局の見解を反映するものではありません。特定の企業またはメーカーの製品に関する記述は、記述されていない類似企業または製品に優先して、WIPOがそれらを推奨していることを意図するものではありません。